3. 遺伝マーカーとSNPについて
• 反復配列
ミニサテライト・VNTR(Variable Number of Tandem Repeat)
10~100bp, 20~50繰り返し配列
マイクロサテライト・STR(Short Tandem Repeat)
約数十万カ所、1~9bp, 5~60繰り返し配列、複数の対立遺伝子
• SNP(Single Nucleotide Polymorphism:一塩基多型)
約1200万カ所、基本はbiallele(2対立遺伝子)
マーカーとしての意味に加え、変位に直接関わっている場合もある
3
4. 遺伝マーカーとSNPについて
ハプロタイプ(Haplotype)
=連鎖した(同一染色体上で近接した)SNPの組合せ
SNP1 SNP2 SNP3
ACACAGGATCACTTGAGGCCAGGAGTT ハプロタイプ1
Aさん
A C A C A T G A T C A A T T G A G G C C A G G A G G T ハプロタイプ2
A C A C A G G A T C A C T T G A G G C C A G G A G T T ハプロタイプ1
Bさん
A C A C A G G A T C A C T T G A G G C C A G G A G T T ハプロタイプ1
1つのSNP(TagSNP)のみを調べれば十分
4
22. 1.PEDファイル
書式
PEDファイル(拡張子は「.ped」)
1列目 Family ID
2列目 Individual ID
3列目 Paternal ID
4列目 Maternal ID
5列目 SEX
6列目 affection status
7列目~(SNP数)数十万列 Genotype
ポイント:サンプル間に血縁関係がない場合
・Family ID = 家族ID
・Individual ID = 個体ID
・Paternal ID = 父親の個体ID
・Maternal ID = 母親の個体ID
study1.ped
その他
・SEX=1:男性、2:女性
・affection status:Control = 1, Case = 2
(発現量や臨床情報などの連続値(QT)も可)
22
23. 2.MAPファイル
書式
MAPファイル(拡張子は「.map」)
1列目 Chrmosome
2列目 SNP identifier
3列目 Genetic distance
4列目 Base-Pair position
ポイント:MAPとPEDの拡張子以前は同じ名前にします
study1.map
23
25. 4.GWASの実行
plink --noweb --bfile study1 --assoc --out study1
以下のファイルが作成
• study1.assoc
study1.assoc
1列目 CHR Chromosome
2列目 SNP SNP identifier
3列目 BP Code for allele 1 (the minor, rare allele based on the entire sample
4列目 A1 frequencies)
5列目 F_A The frequency of this variant in cases
6列目 F_U The frequency of this variant in controls
7列目 A2 Code for the other allele
8列目 CHISQ The chi-squared statistic for this test (1 df)
9列目 P The asymptotic significance value for this test
10列目 OR The odds ratio for this test
29. 6.QTL解析
Phenotypeファイルの準備
phenotypeファイル(拡張子は「.phe」)
1列目 Family ID
2列目 Individual ID
3列目 Quantitative Trait
29
30. 6.QTL解析
QTL解析の実行
plink --noweb --bfile study1 --assoc --pheno param.phe --out study1_qtl
以下のファイルが作成
• study1_qtl.qassoc
QTL解析の結果の書式
study1_qtl.qassoc
1列目 Chr Chromosome number
2列目 SNP SNP identifier
3列目 BP Physical position (base-pair)
4列目 NMISS Number of non-missing genotypes
5列目 BETA Regression coefficient
6列目 SE Standard error
7列目 R2 Regression r-squared
8列目 T Wald test (based on t-distribtion)
9列目 P Wald test asymptotic p-value 30