温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何理解Rfam数据库

发布时间:2021-11-22 19:25:27 来源:亿速云 阅读:347 作者:柒染 栏目:大数据

这篇文章给大家介绍如何理解Rfam数据库,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

Rfam是一个RNA分类信息的数据库,根据多序列比对结果,二级结构的一致性,协方差模型对各种RNA及顺式作用元件进行了分类整理,网址如下

http://rfam.xfam.org/

最新版本为14.0, 在Rfam数据库中,包括以下3大功能类型的分子

  1. ncRNA genes

  2. cis-regulatory elements

  3. self-splicing RNAs


进一步对其进行更为细致的划分,详细列表如下所示

如何理解Rfam数据库

在对这些数据进行分类时,提供了两个层次的分类,familyclan。对于family而言,其成员是上述各种类型的RNA;对于clan而言,其成员是各个family

通过官网的Browser功能,可以方便的浏览数据库中的内容

1. clan

每个clan采用CL开头的编号唯一识别,示意如下

如何理解Rfam数据库

以上图中的CL00051为例,包含了11个family, 详细信息如下

如何理解Rfam数据库

2. family

每个family采用RF开头的编号唯一识别,示意如下

如何理解Rfam数据库

以上图中的RF00005为例,该家族的名字为tRNA, 对应类型为Gene; tRNA, 该家族包含来自9934个物种的RNA分子,其中有三维结构信息的有536个。

对于多序列比对的信息,同时提供了seedfull两种,其中seed是手工整理的已知的该家族成员的多序列比对结果,而full是该家族所有成员序列的多序列比对结果。

3. genome

示意如下
如何理解Rfam数据库

human为例,可以看到对应的序列数和family个数

如何理解Rfam数据库

4.  sequence

每条序列以CM开头的编号唯一识别,示意如下

如何理解Rfam数据库

CM000683.2对应的序列详情如下

如何理解Rfam数据库

通过FTP功能,可以下载该数据库中的内容,FTP链接如下

ftp://ftp.ebi.ac.uk/pub/databases/Rfam

如何理解Rfam数据库

数据库中不仅提供了fasta格式的序列信息,也提供了CM模型,通过infernal软件可以利用这些模型对RNA序列进行判断,从而分析RNA序列对应的family信息。

关于如何理解Rfam数据库就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI