温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

OrthoFinder如何寻找同源基因

发布时间:2021-12-21 10:11:49 来源:亿速云 阅读:537 作者:柒染 栏目:大数据

OrthoFinder如何寻找同源基因,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

构建物种的系统发育树,计算kaks值或者比较基因组学和进化的其他分析都少不了需要寻找同源基因。

之前已经介绍过  Orthomcl的自动化使用,Orthomcl也是目前引用最好的寻找同源基因的工具,但是Orthomcl使用起来比较麻烦,运行速度还不够快。

OrthoFinder的work flow见下图

OrthoFinder如何寻找同源基因

OrthoFinder与其它工具比较的结果见下图

OrthoFinder如何寻找同源基因
(Quest for Orthologs benchmarks and Pareto frontier for methods)  

从图中可以看出  OrthoFinder相比于其它工具,无论是速度还是准确度都有很大的提升。同时在OrthoFinder运行之后,不仅仅寻找了同源基因,它也  构建了gene tree和species tree

OrthoFinder运行速度快的很大原因是使用了DIAMOND/MMseqs来进行蛋白比对。特别是  DIAMOND,它可以得到和blast基本一致的结果的同时,比blast的运行速度快500x-20,000x。


安装运行OrthoFinder

1. 下载安装

        https://github.com/davidemms/OrthoFinder

        可以下载之后源码安装,也可以用conda安装:

conda install -y orthofinder

        ps:强烈建议安装DIAMOND

2. 准备输入数据

        OrthoFinder所需的输入数据很简单,把每个物种的蛋白序列放进单独的fasta文件中,然后把这些fasta文件放到一个目录下。fasta文件命名为对应的物种名。

3. 运行

orthofinder -f Dataset_ directory

       如果你想更改线程数,使用-t参数即可修改。默认的比对工具是DIAMOND,你也可以通过-S指定blast等其他工具。其他参数详情可以运行 orthofinder -h 看到。

    

 4. 结果文件

        在结果文件夹中,Orthogroups文件夹里面有所有的同源基因信息,还贴心的单独给出了单拷贝同源基因信息。Gene_Trees 和 Species_Tree 文件夹分别是单独的同源基因构建的tree已经整合所有同源基因构建的物种树。

Note:

1. 可以指定-M参数来指定物种树的构建算法。OrthoFinder默认的方法是STAG算法。STAG整合了所有的同源基因(包括多拷贝基因),这种方法特别适合物种遗传距离较远,单拷贝同源基因很少甚至没有的情况。

同样,可以指定只使用单拷贝基因来构建物种树,-M raxml 就会调用Raxml进行构建。

2. Orthogroups文件夹中的 Orthogroups.GeneCount.tsv 统计了同源基因在每个物种中的数目,可以利用这个文件很方便的挑选我们需要的基因。

关于OrthoFinder如何寻找同源基因问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI