小编给大家分享一下Haplotype Reference Consortium数据库有什么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
在进行基因型填充时,reference panel的选择对填充结果的影响非常大,HapMap包含了3百多万个SNP位点,420个单倍型,1000G包含了8千多万个位点,5008个单倍型。除了这两个常用的reference panel外,还有很多大型的人类基因组测序项目,比如UK10K等等。reference panel包含的单倍型越多,填充的准确率越高,涵盖的SNP位点越多,填充后可以用于GWAS分析的位点就越多,可以更加有效的挖掘关联信号。
Haplotype Reference Consortium简称HRC, 整合了来自UK10K, 1000G等多个项目的结果,构建了一个包含3千多万个SNP位点,64976个单倍型的reference panel, 对应的文章发表在nature genetics上,链接如下
https://www.nature.com/articles/ng.3643
在文章中比较了不同reference panel对填充准确率的影响,结果如下
横坐标为study样本中不在reference panel中的SNP位点比例, 纵坐标为填充的准确率,可以看到HRC的填充准确率明显高于UK10K和1000G。另外,对于reference panel对于GWAS结果的影响也进行了比较,结果如下
展示的是14号染色体上的曼哈顿图,rs28929474是阳性结果,从左侧到右侧,分别对应hapmap, 1000G和HRC。使用HapMap填充,没有识别到该阳性位点,1000G和HRC都识别到了该阳性位点。
HRC官网链接如下
http://www.haplotype-reference-consortium.org/
包含的基因组测序项目如下
大部分为低深度全基因组测序的结果,共包含了32611个样本,遗憾的是,该数据库的信息并没有完全公开,目前只有通过两个在线网站,可以使用该数据库进行基因型填充,网址如下
https://imputation.sanger.ac.uk/
https://imputationserver.sph.umich.edu/
在EBI中,包含了该数据库的一个子集供下载,网址如下
https://www.ebi.ac.uk/ega/studies/EGAS00001001710
对于基因型填充而言,构建更大规模单倍型数据库是提高准确率的有效方法,采用HRC数据库,可以有效提供填充准确率。
以上是“Haplotype Reference Consortium数据库有什么用”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。