如何理解ESP数据库,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
ESP 全称是NHLBI Exome Sequencing Project, 是由多个大学和研究结构合作开展的一个大型的外显子测序项目,主要目的是通过NGS技术对不同人群进行SNP分型,来辅助心脏,肺,血液相关疾病的研究。
通过首页的Data Browser
按钮,可以检索数据库。可以通过以下4种方式进行检索:
HUGO命名的gene symbol
Entrez Gene ID
染色体区域
dbSNP rs ID
检索结果中提供了两种人群的结果
EuropeanAmerican
AfricanAmerican
在结果展示的页面,给出了每个变异位点相关的详细信息。
这部分内容会给出基因的symbol, ID,染色体区域等基本信息,还会给出pathway, COSMIC, STRING, OMIM等数据库的链接
通过单选框,对变异位点的表头进行筛选
根据前面筛选的表头,展示每个变异位点对应的信息
不同类型的变异位点填充色是不同的,颜色和变异类型的对应关系如下
检索的结果是可以下载的,点击右上角的download
按钮即可下载,支持text
和vcf
两种格式。
除了检索之外,还可以一次下载整个数据库中的内容,点击首页的Download
按钮即可跳转到下载页面。
该页面提供的数据是对6503例样本的分析结果,变异位点的位置是基于hg19版本的,为了适配hg38版本,新增了字段来存储hg38版本上的位置信息。提供了5个文件供下载,可以分成3类
1.SNP分型结果
ESP6500SI-V2-SSA137.GRCh48-liftover.snps_indels.txt.tar.gz ESP6500SI-V2-SSA137.GRCh48-liftover.snps_indels.vcf.tar.gz
2.测序覆盖度结果
ESP6500SI-V2.GRCh48-liftover.coverage.all_sites.txt.tar.gz ESP6500SI-V2.coverage.seq_blocks.txt.tar.gz
3.外显子目的区域文件
agilent_nimblegen_exome_targets_esp_project.tar.gz
通常情况下,下载VCF文件就可以了。
看完上述内容,你们掌握如何理解ESP数据库的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注亿速云行业资讯频道,感谢各位的阅读!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。