这篇文章将为大家详细讲解有关Dfam数据库有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
Transposable elements 转座元件占真核生物基因组很大一部分,对转座元件的精确注释有助于研究其生物学特性,揭示基因组的进化过程。
Dfam数据库对多个真核生物的转座元件进行多序列比对,构建了转座元件的家族信息。官网如下
http://www.dfam.org/
目前最新版本为Dfam 2.0, 对于每个家族,以DF编号唯一标识,示意图如下
Dfam同时还提供了一个隐马尔可夫模型,可以用于序列比对,下载地址如下
http://www.dfam.org/web_download/Release/Dfam_2.0/
和Dfam类似,还有一个Dfam Consensus 数据库,该数据库对基因组上的重复序列进行了详细分类,链接如下
http://www.dfam-consensus.org/#/public/te_classes/
Low_Complexity代表低复杂度序列,指的是富含某些碱基,比如富含AT的序列;Tandem_Repeat代表串联重复序列,motif长度为2-10bp的串联重复序列称为Simple_Repeat, 也叫做简单串联重复序列或者为微卫星序列,motif长度在几百bp左右的串联重复序列,叫做Satellite, 卫星DNA序列。
Interspersed_Repeat代表散落在基因组多个地方的重复序列,比如转座子,假基因等序列。
RepeatMasker会利用这个数据库的数据去分析基因组上的重复序列。该数据库提供了重复元件的序列信息,可以下载。
关于“Dfam数据库有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。