本篇文章为大家展示了如何使用DREME挖掘序列中的de novo motif,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
DREME也是一款常用的de novo motif分析软件,它具有以下几个特点
只支持核酸序列,即DNA和RNA序列的motif分析,不支持氨基酸序列
DREME需要两个序列集合,其中一个作为control,主要功能是挖掘相比control, 在另外一个集合中相对富集的motif
将contorl对应的序列集合称之为negative sequences, 将另一组称之positive sequences,采用费舍尔精确检验分析motif在positive出现的次数是否比negative中出现的次数更多。
如果你只提供了一个序列集合,则采用碱基随机抽样的方式根据你提供的序列模拟出一组contorl序列,这种方式构建的序列集合也称之为shuffled sequences。
在线工具的网址如下
http://meme-suite.org/tools/dreme
同时提供control和input序列集合就可以了,需要注意的是,两个集合中的序列个数必须一致,序列的长度在100bp左右最佳, 通常采用peak中心上下游各50bp的序列即可。
输出结果如下所示
同时在输入的序列和其反向互补链上查找motif, 输出结果中RC Logo代表反向互补链上的motif。点击每个More
可以查看每个motif的具体信息,示意如下
给出了该motif和对应的碱基组合在两个序列集合中次数的个数统计和对应的p值等信息,需要注意的是,这里的个数统计不是简单的统计该字符在输入序列中出现的次数,而且在分析总的motif和对应的各种碱基组合的次数时是独立的操作,所以不是说每种碱基组合的次数叠加就是总的motif的次数。
DREME对应的命令行版本的基本用法如下
dreme -oc out_dir -png -p input.fa
DREME适用于发现长度在3-8bp之间的motif, 而MEME的motif长度可以通过参数调整,适用范围更大。
上述内容就是如何使用DREME挖掘序列中的de novo motif,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。