这篇文章将为大家详细讲解有关Pfam数据库有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
在蛋白质分子中,包含多个结构特异并且功能区里的区域,这些区域称之为domain, domain 可以看做蛋白质功能的基本单位,蛋白质的功能由包含的多个domain共同决定。研究domain, 可以更好的研究蛋白质功能。
Pfam是蛋白质家族的数据库,根据多序列比对结果和隐马尔可夫模型,将蛋白质分为不同的家族。网址如下
http://pfam.xfam.org/
在该数据库中,提供了以下2个不同层级蛋白质家族信息。
每个family以PF编号唯一标识,示意如下
所有的family可以分为以下6种类型
Family
A collection of related protein regions
Domain
A structural unit
Repeat
A short unit which is unstable in isolation but forms a stable structure when multiple copies are present
Motifs
A short unit found outside globular domains
Coiled-Coil
Regions that predominantly contain coiled-coil motifs, regions that typically contain alpha-helices that are coiled together in bundles of 2-7.
Disordered
Regions that are conserved, yet are either shown or predicted to contain bias sequence composition and/or are intrinsically disordered (non-globular).
对多个family进行相似性分析,将具有相似的三维结构或者相同motif的family归为一个clan, 可以看做是superfamily的概念,每个clan以CL编号标识,示意如下
除此以外,还提供了物种的蛋白质组信息,就是该物种内所有的蛋白质family 信息,示意如下
以human为例,其蛋白质组的信息如下
其实就是该物种的所有蛋白质对应的Pfam的集合。
该数据库最新版本为31.0, 于2017年3月更新,包含16712个蛋白质家族信息。ftp地址如下
ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam31.0/
后缀为hmm
的文件是由HMMER3构建的隐马可夫模型,可用于序列比对。
关于“Pfam数据库有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。