适用于基因组规模的多序列比对工具kalign是怎样的,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
之前提到的clustalo, muscle, mafft 适用于几千到几万条序列的多序列比对,在比较基因组学的分析中,需要对不同基因组的序列进行多序列比对。对于基因组规模的多序列比对而言,之前的工具运行速度上就不够理想了。
kalign 是一款针对大规模序列的多序列比对工具,无论是运行速度,还是比对的准确度,都令人满意。
在对应的文献中,利用测试数据集,评估了不同软件的运行速度和多序列比对的准确度,结果如下
从速度上看,Kalign遥遥领先,从准确到上看,kalign和muscle, mafft 的准确度非常接近。
kalign支持核酸和蛋白质的多序列比对,软件的安装过程如下
wget http://msa.sbc.su.se/downloads/kalign/current.tar.gz tar xzvf current.tar.gz ./configure make
编译好的可执行文件的名字为kalign
, 基本用法如下
kalign input.fa > out.fa
默认输出fasta格式的多序列比对结果,也支持clustalw, msf 等格式。
看完上述内容,你们掌握适用于基因组规模的多序列比对工具kalign是怎样的的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注亿速云行业资讯频道,感谢各位的阅读!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。