温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

MUSCLE软件有什么用

发布时间:2022-02-23 10:44:02 来源:亿速云 阅读:428 作者:小新 栏目:开发技术

这篇文章将为大家详细讲解有关MUSCLE软件有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

1、软件介绍

MUSCLE(Multiple Protein Sequence Alignment)是一款蛋白质水平多序列比对的软件,在速度和精度上都优于 ClustalW。在进行多序列比对的时候,大多数情况下可以优先使用 MUSCLE。有本地版和在线版,在线版网址如下:http://www.ebi.ac.uk/Tools/msa/muscle/。

2、算法原理

算法:MUSCLE 先使用渐进式比对(progressive alignment)获得初始的多序列比对,再使用横向

精炼(horizontal refinement)迭代提高多序列比对结果。

1)使用数串(k-mer counting)方法构造序列间的全局比对和局部相似度

2)填充序列间距离的三角矩阵

3)使用 UPGMA 或 NJ 法构建序列发生树,并确定无根树的根

4)从叶节点开始向上推测父节点的渐进式比对,最后产生根节点的多序列比对

5)根据得到的多序列比对,计算任两序列间的相似度

6)计算 Kimura 距离矩阵,构建发生树

7)比较新生成的树和原来树的差异,如果有节点的重排,跳转到步骤 4

8)从树上砍断一个枝,产生两个子树,每次砍断的位置是按和根的距离降序排列的

9)分别计算两个子树的多序列比对,并对两个结果比对得到新的多序列比对

10)如果新的比对结果的 SP 分数(sum of pairs)降低,保留这个新的比对结果,反之

丢弃。反复迭代 8->9->10,直到分值不再降低或达到最大迭代次数。

3、使用命令

MUSCLE 使用起来十分方便,大多数情况下用户只需要指定输入输出文件即可

$ muscle -in file1 -out file2

输入文件截图:

>a

ATGAGGTAGAGATAGCCGG

>b

ATGGTTAGCCGG

结果文件截图:

>a

ATGAGGTAGAGATAGCCGG

>b

ATG———-GTTAGCCGG

运行程序log:

MUSCLE v3.8.31 by Robert C. Edgar

http://www.drive5.com/muscle

This software is donated to the public domain.

Please cite: Edgar, R.C. Nucleic Acids Res 32(5), 1792-97.

1 2 seqs, max length 19, avg  length 15

00:00:00    11 MB(-1%)  Iter   1  100.00%  K-mer dist pass 1

00:00:00    11 MB(-1%)  Iter   1  100.00%  K-mer dist pass 2

00:00:00    12 MB(-1%)  Iter   1  100.00%  Align node

00:00:00    12 MB(-1%)  Iter   1  100.00%  Root alignment

4、生物信息中的利用

目前muscle 主要用来在基因组进化部分,因为构建进化树和计算选择压力,都需要将序列对齐,muscle小而快,毋庸置疑是最好的选择。

关于“MUSCLE软件有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI