温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何进行一键批量计算ka和ks

发布时间:2021-12-10 11:15:43 来源:亿速云 阅读:464 作者:柒染 栏目:大数据

今天就跟大家聊聊有关如何进行一键批量计算ka和ks,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。


ParaAT安装


    1. 下载ParaAT2.0

    (https://bigd.big.ac.cn/tools/paraat)

解压后,“ParaAT.pl”是运行的脚本。可以把解压后的路径加入环境变量,或者用脚本所在的绝对路径来运行也可以。

    2. 安装所需的依赖工具,依赖工具需要加入环境变量

  • 蛋白比对工具,推荐安装muscle,比对效果相对最好,比对速度快,但

它比其它工具更消耗内存。
  • KaKs_Calculator (http://bigd.big.ac.cn/tools/kaks)



准备输入文件



    1. 同源基因列表,文件格式如下:

geneA1  geneA2  geneA3geneB1  geneB2  geneB3geneC1  geneC2  geneC3geneD1  geneD2  geneD3

每一行表示一组同源基因,每一列表示每个物种对应的基因。gene ID之间用tab符隔开。

    2. fasta格式的蛋白序列文件和核酸序列文件,注意gene ID要与同源基因列表文件中的ID一致;

    3. 多线程运行,指定线程数量的文件。

这个文件只需要写入一个数字即可,表示有多少个线程同时运行。

三种示例文件可以在解压的安装包中找到,分别是:test.homologs, test.pep, test.cds, proc


运行ParaAT

运行代码如下:

ParaAT.pl -h test.homologs -n test.cds -a test.pep -p proc -m muscle -g -k -o result_dir

-h, 指定同源基因列表文件

-n, 指定核酸序列文件

-a, 指定蛋白序列文件

-p, 指定多线程文件

-m, 指定比对工具

-g, 去除比对有gap的密码子

-k, 用KaKs_Calculator 计算kaks值

-o, 输出结果的目录

注:

1. 如果需要用PAML,Hyphy等工具分析kaks时,ParaAT也可以生成这些工具所需的输入文件(-f 参数)

2. 如果是细菌的序列,需要设置成细菌对应的Genetic Code used (-c 11)。其他物种同理,默认的是The Standard Code (-c 1)

看完上述内容,你们对如何进行一键批量计算ka和ks有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注亿速云行业资讯频道,感谢大家的支持。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

ka ks
AI