群体遗传分析方法:LD,FST,eQTL
LD(连锁不平衡):计算使用plink, FST(遗传分化指数):计算使用vcftools,可视化分为箱线图和散点图,单组比较使用在染色体上的散点图,多组比较使用箱线图。 FST的原理,计算方法,可视化的方法 https://www.jianshu.com/p/bb0beec0ed63 haploPS和XP-EHH 平均测序深度: 等位基因频率: vcftools使用说明:1. https://www.dazhuanlan.com/2020/03/04/5e5f850672ddf/
FST计算方法
Fst值的取值范围是[0,1],最大值为1表明两个群体完全分化,最小值为0表明群体间无分化。 实际使用FST<0--0.05,表示群体分化很小;0.05--0.15,中等程度的分化;0.15--0.25,较大的分化;0.25以上,分化很大。 其实Fst分析就是看两个群体之间分化程度的一种方法,Fst值越大(越接近1)表明两个群体间分化程度越高,亲缘关系越远;Fst值越小(越接近0)表明群体间分化程度越低,亲缘关系越近。 分为按照SNP单点计算和滑动窗口模式计算,一般使用的是滑动窗模式
# SNP单点计算
vcftools --vcf sample.vcf --weir-fst-pop population_1.txt --weir-fst-pop population_2.txt --out sample_1_2
滑动窗口模式计算
vcftools --vcf test.vcf --weir-fst-pop population_1.txt --weir-fst-pop population_2.txt --out P_1_2 --fst-window-size 500000 --fst-window-step 50000
参数说明: --vcf 输入vcf文件 --weir-fst-pop 输入群体的群体ID名,该文件必须是txt格式,每个ID占一行。 --fst-window-size 500000 --fst-window-step 50000 ,这里窗口设置为500kb,步长设置为50kb。根据情况调整窗口大小。 计算haploPS、XP-EHH、 Fst,正向选择分析方法寻找性状相关的位点(拿几个群体的重测序数据,轻松发核心中文或者<3的SCIE)
π的计算
π,核苷酸多样性,越大说明核苷酸多样性越高,越低说明两个座位DNA序列差异越小。 vcftools
LD-blockde 计算
计算和可视化,参考
分析方法 参考文献:中国农业科学 scientific reports
找到重测序的数据,基因分型,找到单倍型,call SNP,过滤,注释snp,可视化,分别计算haploPS,XP-EHH,Fst.求交集,公共基因进行注释,富集分析。
eQTL (转录组+snp):Matrix eQTL R包 http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html#inst
https://www.jianshu.com/p/6e6d54d7483e
群体结构图形——structure堆叠图 https://www.jianshu.com/p/c7a4fb935e42
https://www.genedenovo.com/news/364.html
群体遗传学亲缘关系分析 https://www.jianshu.com/p/2677dc3b1383
群体结构PCA https://www.jianshu.com/p/c99de8e5571a
从GWAS摘要统计信息估算遗传力和遗传相关性ldsc
LDSC github
vcftools --vcf F2_3.vcf --plink --out F2_3
#把vcf格式转为plink格式