这篇文章将为大家详细讲解有关Gene Ontology数据库有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
Gene Ontology, 中文名叫做基因本体论,采用GO terms描述基因产物的功能, 并且提供了不同GO terms 之间的关系。官网如下
http://geneontology.org/
GO定义的基因功能分成以下3大类别:
molecular function
cellular component
biological process
所有GO term构成了一个有向无环图,示意图如下
每个GO是图中的一个节点,GO之间的连线表示图中的边的信息。不同GO之间的箭头是有方向的,代表特殊含义的,所以构成的网状结构叫做有向无环图。
需要注意的是,GO之间的关系不是一个树状结构,首先BP,CC, MF 这3个节点是独立的,没有公共父节点的;其次,GO没有树状结构中严格的层级关系。所有也有父节点,子节点的概念,但是层级关系不明显,一个GO可以有多个父节点。
每个GO term用一个唯一的GO编号表示,前缀为GO, 后面是6位数字,比如GO:0015749
。由于GO是基于已有的生物学知识构建的,而这些认知是不断修正和完善的,所有会存在有的GO term被删除了,或者是和其他GO Term合并的情况。
不同GO term之间的关系是多种多样的,以下只讨论几种常见的关系
is a
part of
hast part
regulation
is a
关系的示意图如下
线粒体是细胞器的一种, 两者之间的关系是 线粒体is a
细胞器。
part of
关系的示意图如下
线粒体是细胞质的组成部分,二者之间的关系是线粒体part of
细胞质。
has part
关系的示意图如下
通常用于描述细胞内各种复合体之间的关系。
regulation
表示调控关系,示意图如下
对于调控关系而言,有正调控和负调控两种。
所有GO Terms的信息可以通过以下链接进行下载
http://www.geneontology.org/page/download-ontology
提供了obo
, owl
等格式,通常情况下,使用go-basic.obo 文件就就可以了。
GO本身是一个跨物种的概念,官方提供的GO文件涵盖了大部分的物种的所有功能。但是对于特定领域的物种来说,其功能只占整个GO的一部分,此时,可以从整个GO中抽取出对应的部分,构成一个子集,这个子集就叫做GO Slim, 在以下链接中,提供了不同领域的GO Slim。
http://www.geneontology.org/page/go-subset-guide
对于特定的物种,采用合适的GO Slim, 可以有效减少后续数据挖掘的工作量。
在官网上, 还提供了部分物种的GO注释信息,链接如下
http://www.geneontology.org/page/download-go-annotations
除此之外,还提供了GO与其他数据库,比如KEGG Pathway, RDP, COG等数据库的映射关系,链接如下
http://www.geneontology.org/page/download-mappings
InterPro与GO的映射关系示例如下
InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:DNA binding ; GO:0003677 InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:steroid hormone receptor activity ; GO:0003707 InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:zinc ion binding ; GO:0008270 InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:regulation of transcription, DNA-templated ; GO:0006355 InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:nucleus ; GO:0005634
关于“Gene Ontology数据库有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。