千人基因组计划数据库下载某段区域SNP

时间:2021-11-26 11:36:29

进入http://browser.1000genomes.org/index.html网站

假定要寻找“6:133098746-133108745”这段距离的SNP数据,“6”表示6号染色体,后面的数据表示距离。

千人基因组计划数据库下载某段区域SNP

点击“Go”,进入如下界面后,再点击左栏的“Get VCF data”

千人基因组计划数据库下载某段区域SNP

弹出如下界面,再继续点击“VCF to PED converter”

千人基因组计划数据库下载某段区域SNP

再点击“Next”

千人基因组计划数据库下载某段区域SNP

接下来,弹出来的窗口让你选择种族(population),比如有中国CHB,日本JPT,挑选完感兴趣的种族,然后点击“Next”

千人基因组计划数据库下载某段区域SNP

弹出来的界面有如下两种格式“Marker Information File”,“ Linkage Pedigree File”,右击另存为文件,保存下来的这两种文件即为.info和.ped格式,后续可以进行连锁分析。

千人基因组计划数据库下载某段区域SNP

注意:此方法保存的info文件和ped文件只包含了单个碱基改变的SNP,长片段的indel是被删除的,如果想要分析长片段的indel和周围SNP的连锁不平衡分析,需要自己手动下载VCF文件再自行处理。