今天就跟大家聊聊有关如何理解clinvar数据库,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
clinvar 和 OMIM 数据库类似,都是存储了人类变异位点和表型之间的关系。
clinvar是一个开放的数据库,每个研究机构都可以向其提交数据,对于提交的信息,会有专家团队进行审核评级。对于数据库中的位点,根据注释信息的可靠性,分成了1到4个不同的星级,星级越高,可信度越高。截至到2018年5月29日,数据库中所有记录统计如下
可以发现,在整个数据库中,3星和4星的变异位点是非常少的,最多的是1星的变异位点。
在该数据库中,提供了以下7种检索方式
gene symbols
HGVS expressions
protein change
rs number
disease
submitters
location on a chromosome
以PTEN
这个gene symbol为例,检索出的部分记录如下:
对于每条记录,都会给出以下三种信息。
对于每条变异位点的记录,都有一个Variation ID
, 和对应的星级评分。
不同星级代表的含义如下:
这部分会给出突变位点的临床意义Clinical significance
, 和相关数据库的链接,这些数据库通常包含MedGen
, OMIM
, dbSNP
, PubMed
等。
这部分会给出allel
的详细信息,包括变异类型,HGVS
表达式等信息。
我们可以通过FTP服务,直接下载该数据库。链接如下
ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/
在ftp服务器上提供了多种格式,通常选择VCF下载即可,而且同时给出了hg19和hg38两个版本的vcf文件。
看完上述内容,你们对如何理解clinvar数据库有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注亿速云行业资讯频道,感谢大家的支持。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。