这篇文章将为大家详细讲解有关HiCPlotter工具有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
HiCPlotter是一款命令行工具,用来展示Hi-C的交互矩阵。除了基本的用热图展示交互矩阵外,还支持添加基因结构,chip_seq等二维数据的注释信息,网址如下
https://github.com/kcakdemir/HiCPlotter
对于交互矩阵,支持多种格式
Hi-C交互矩阵以bin
为单位,每行和每列都代表一个bin
, 对应单元格的数值反映两个bin
之间相互作用的频率。通用格式如下所示
Bin1 Bin2 Bin3 Bin4 Bin5 Bin6
7.85957 4.80329 11.4766 9.57416 4.5288 8.55022
8.61621 4.98956 2.35654 5.69483 11.1187 10.1322
4.06803 4.07801 7.98047 2.59144 6.3851 7.74306
4.52869 2.70624 8.94544 4.29185 8.29491 8.38257
#
开头的行以及第一行都被当做是注释信息,会被忽略掉。
HiC-Pro为了解决传统的交互矩阵太大的问题,专门制定了一种新的格式,如下所示
1050 1586 1
1050 1589 1
1050 1590 1 (jumps to 1612)
1050 1612 2
共三列,前两列对应bin
的编号,第三列的数字代表两个bin
之间交互作用的频率,不存在相互作用的bin
就不会记录在该文件之中。除了这个文件,还需要下列文件
chr1 20960000 20980000 1049
chr1 20980000 21000000 1050
chr1 21000000 21020000 1051
chr1 21020000 21040000 1052
chr1 21040000 21060000 1053
chr1 21060000 21080000 1054
chr1 21080000 21100000 1055
给出了每个bin
编号对应的染色质位置,通过这两个文件就可以完整描述描述染色质交互信息了。
软件的基本用法如下
python 、\
HiCPlotter.py \
-f matrix.txt \
-n hES \
-chr chr21 \
-r 40000 \
-o default1 \
-f
参数指定输入的Hi-C交互矩阵,-n
指定交互矩阵热图的标题名称,-chr
指定要画的染色质的名称,-r
指定对应的分辨率,-o
指定输出文件的前缀, 结果示意如下
对于HiC-Pro的输出格式,用法如下
python \
HiCPlotter.py \
-f matrix.txt \
-tri 1 \
-bed bin.bed \
-chr chr7 \
-o Example \
-r 40000 \
-n hES
-tri 1
声明输入的交互矩阵的格式是HiC-Pro的输出格式,-bed
指定bin
编号对应的染色质位置文件,其他参数和基本用法相同。
该软件支持同时可视化多个交互矩阵,用法如下
python \
HiCPlotter.py \
-f matrix1.txt matrix2.txt matrix3.txt \
-n name1 name2 name3 \
-chr chr6 \
-r 40000 \
-o example
对应的-f
和-n
参数为空格分隔的多个参数,结果示意如下
除了上述基本用法,还可以添加注释信息,比如基因结构,对应chip_seq数据等,结果示意如下
此时需要输入各种注释信息对应的文件,对于不同的注释信息,要求的格式不同,更多的细节请参考官方文档。
关于“HiCPlotter工具有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。