ゲノムと転写産物間の座標の変換
メモメモ

### 関連サービス

- **Mutalyzer** (https://mutalyzer.nl/) のなかのPosition Converter
  - GitHub: https://github.com/mutalyzer/mutalyzer
- **TransVar** (http://bioinformatics.mdanderson.org/transvarweb/)
  - コマンドライン版もある
- **UCSCゲノムブラウザ** がHGVS nomenclatureに最近対応した
  - 例: 検索窓に NM_198056.2:c.1654G>T を入力
- **TogoWS UCSC API**
  - 例: http://togows.org/api/ucsc/hg38/refGene/name=NM_003380
  - 例: http://togows.org/api/ucsc/hg38/refGene/name=NM_003380/cds

###  座標変換の元になるデータ

- RefSeqのfeature table
  - 例: https://www.ncbi.nlm.nih.gov/nuccore/NC_000001.11?report=gbwithparts
```
mRNA       join(6613696..6614105,6616757..6616858,6619803..6620337,
           6621411..6624033)
           /gene="PHF13"
           /gene_synonym="PHF5; SPOC1"
           /product="PHD finger protein 13"
           /note="Derived by automated computational analysis using
           gene prediction method: BestRefSeq."
           /transcript_id="NM_153812.2"
           /db_xref="GeneID:148479"
           /db_xref="HGNC:HGNC:22983”
```
- UCSCの refFlat.txt.gz や **refGene.txt.gz**
  - http://togows.org/api/ucsc/hg38/refGene/name=NM_003380 の元データになっている
  - ここにある http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/
  - NM_003380.3 じゃなく NM_003380 までしか出ていないのが困る
- **LRG** (Locus Reference Genomic) (http://www.lrg-sequence.org/)
  - 現在は有名な遺伝子のみ。網羅的ではない

### その他資料

- **Sequence Variant Nomenclature** (http://varnomen.hgvs.org/)
  - variationの表記の解説。けっこう複雑。
  - http://varnomen.hgvs.org/bg-material/numbering/ の図がわかりやすい
- 単純に座標変換だけをやりたい場合は？
