温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

gencode数据库有什么用

发布时间:2022-01-17 10:51:02 来源:亿速云 阅读:215 作者:小新 栏目:大数据

这篇文章将为大家详细讲解有关gencode数据库有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

对于人和小鼠而言,NCBI, Ensembl等数据库都保存了对应的基因注释信息,不同数据库中的信息来源和可信度都不一样,gencode综合HAVANA和Ensembl 数据库中的信息,通过实验手段加以验证,从而构建一个高质量的注释信息数据库。网址如下

https://www.gencodegenes.org/

官网提供了GTF和GFF3两种格式的文件以供下载,示意如下

gencode数据库有什么用

每种类型的文件提供了3种区域

  1. CHR

  2. ALL

  3. PRI


对于基因组而言,包括了chromsomeunplaced_scaffold, alt_scaffold, patch等序列,这些序列上都存在对应的基因。CHR指的是染色体级别的信息,包括细胞核内的染色体和线粒体;ALL包括所有的序列,PRI只包含染色体和unplaced_scaffold序列上的信息。官方推荐,使用CHR级别的信息。

文件中采用level来表示注释信息的可信度,目前共包括3个level。

level1代表可靠的注释信息,有直接的实验证据支持的注释信息;level2代表的是经过人工校对的注释信息,取HAVANA和Ensembl注释信息中一致的注释信息;level3指的是软件注释的信息,通常是Ensemble中和HAVANA不一致的注释信息。

如果想要得到更高可信度的注释信息,可以根据level进行过滤,只选择1和2这两个层级的注释信息。

文件中共包含的基因和转录本的个数统计如下

1. human

gencode数据库有什么用

2. mouse

gencode数据库有什么用

在文件中,会给出基因或者转录本的类型信息,解释如下

  1. protein_coding
    蛋白编码基因

  2. lincRNA
    位于基因间区的长链非编码RNA

  3. non_coding
    文献中证实的非编码RNA


关于“gencode数据库有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI