这篇文章主要介绍了在chip_seq数据分析中peak注释信息的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
在chip_seq数据分析中,peak calling是核心,得到peak区间之后,我们首先需要对peak进行注释。所谓的注释其实是一个比较宽泛的概念,其中包含了以下多种类型的注释信息
profile是一个生信分析中的高频词汇,在不同组学数据中有不同的含义,在这里代表的是peak区域的reads在基因组上的分布。最基础的注释内容就是查看peak区域的reads在各个染色体上的分布,示意如下
enrichment代表的是富集,这里的富集是针对某个特征位点而言的,比如最常见的在转录起始位点两侧peak reads的分布图,示意如下
折线图反映的是所有转录本上peak区域reads的分布情况,为了将所有转录本用一个值来表示,通常会取均值。对应的还有一种热图的展示方式,每一行代表一个转录本,示意如下
除了TSS这种单个位点的分布外,还可以展示整个基因组上的分布,示意如下
这种注释主要分析peak区间与基因组各种区间的overlap情况,比如5’UTR,3’UTR, exon等区域,然后绘制饼图或者柱状图,示意如下
根据注释文件的不同,划分的基因组区域也有所变化。
这部分注释主要分析peak区间与基因的关系,可以细分为overlap gene和nearest non-ovlap gene两种。第一种分析确定peak区间位于哪些基因的区域,示意如下
第二种分析peak上下游最近的区间没有交集的基因,示意如下
之所以做基因注释,是为了探究转录因子或者组蛋白修饰的靶基因,目前对于靶基因的筛选策略并没有统一的说法,以上两种注释筛选出来的基因都可以作为候选的靶基因,然后进行后续的GO/KEGG等功能富集分析。
感谢你能够认真阅读完这篇文章,希望小编分享的“在chip_seq数据分析中peak注释信息的示例分析”这篇文章对大家有帮助,同时也希望大家多多支持亿速云,关注亿速云行业资讯频道,更多相关知识等着你来学习!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。