小编给大家分享一下Pacbio中CD-HIT合并策略优缺点有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
Pacbio三代无参全长转录组(IsoSeq3) 的转录本合并策略
Pacbio三代全长转录组,采用IsoSeq3进行转录本的过滤,合并和校正,得到高质量的转录本,但是这些转录本之间还是存在一定的序列冗余,需要进行一定的序列合并操作。
Pacbio官方目前推荐两种策略,分别是:采用CD-HIT合并 与采用Cogent进行基因预测和序列合并。
现将两种策略的优缺点进行比较:
1. 优点:
1.1 合并速度快,而且cd-hit这软件也是比较经典的一款软件,在转录组分析中经常用到
1.2 结果容易理解: 该软件就只是简单的基于序列的相似性,进行转录本的合并,转录本的ID都不会变动。
2. 缺点:
2.1 无法区分那些转录本来自同一个基因。
2.2 无法提供转录本序列质量信息
1 优点:
1.1 提供基因和转录本水平的信息,当然这个所谓的基因水平,也只是Cogent的一种分析策略
1.2 也支持一定的序列质量筛选,比如覆盖度等。
2 缺点
2.1 软件运行时间长,速度比较慢。而且Cogent软件的安装比较麻烦
2.2 结果不容易理解:Cogent会对序列先进行聚类划分,之后对序列进行合并,得到更长的基因区域序列。
以上是“Pacbio中CD-HIT合并策略优缺点有哪些”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。