这篇文章主要讲解了“如何使用TADbit识别拓扑关联结构域”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何使用TADbit识别拓扑关联结构域”吧!
TADbit是一个hi-c数据分析的软件,提供了从原始数据处理到染色质三维模型构建的完整功能,对应的文章链接如下
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5540598/
该软件的pipeline如下图所示
总体分成以下3个功能模块
FASTQ
Interacton Matrix
3D Models
第一个模块从原始的fastq文件开始,对序列进行质量过滤,采用GEM
软件将clean reads比对参考基因组,然后进行筛选,构建原始的交互矩阵,并进行归一化处理,得到归一化之后的交互矩阵。
第二个模块用于可视化hi-c交互矩阵,并且可以在交互矩阵的基础上,识别TAD
拓扑关联结构域,对TAD
进行可视化,聚类等分析。
第三个模块用于构建染色质三维构象的模型,并进行结构分析。
本文简单整理下第二个模块的具体用法,详细步骤如下
该软件采用python
进行开发,采用了面向对象的编程思想,首先要做的就是构建一个object
, 构建的过程中需要对应的hi-c交互矩阵, 软件自带的测试数据集包含了以下两个hi-c矩阵
HIC_gm06690_chr19_chr19_100000_obs.txt
HIC_k562_chr19_chr19_100000_obs.txt
对应GM06690
和K562
两种细胞系19号染色体100kb分辨率下的交互矩阵。基于这两个交互矩阵构建对象并可视化的代码如下
可视化的效果图如下
有两种可视化的策略,第一种是在hi-c的热图上用矩形标记TAD区域,第二种称之为density plot, 用法如下
热图标记TAD之后的效果图如下
density plot的效果图如下
将多个细胞或组织的TAD
进行比较,可以分析其位置是否具有保守性。用法如下
效果图如下所示
TADbit的用法简单,可视化效果也很棒,唯一的缺点就是安装特别费劲。
感谢各位的阅读,以上就是“如何使用TADbit识别拓扑关联结构域”的内容了,经过本文的学习后,相信大家对如何使用TADbit识别拓扑关联结构域这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。