这篇文章将为大家详细讲解有关mutagene是什么数据库,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
mutagene是一个肿瘤突变频谱数据库,从ICGA, TCGA等肿瘤项目中收集整理蛋白编码基因上的体细胞突变数据,分析识别对应的突变频谱
网址如下
https://www.ncbi.nlm.nih.gov/research/mutagene/
通过Explore
菜单,可以查看数据库中收录的突变频谱信息,包括两个部分
根据以下4种条件,分别计算突变频谱
Cancer types
Primary tumor sites
Benign samples
Cancer Census Genes
以肿瘤类型为例,结果示意如下
每个突变频谱用一个MG
开头的编号唯一标识,提供了对应的频率分布柱状图,示意如下
采用NMF
非负矩阵分解算法,从突变频谱中提取突变特征,提供了以下几种特变特征
MUTAGENE-5 signatures
MUTAGENE-10 signaltures
COSMIC-30 signatures
结果如下所示
通过Compare
可以比较不同的突变频谱,根据样本的突变频谱进行聚类,结果示意如下
多个突变频谱的比较,结果用热图来呈现,定义了以下4种距离来衡量不同突变频谱之间的差异
Chi-squared distance
Cosine distance
Helliger distance
Jensne-Shannon distance
详细的计算公式可以参考官方文档,多个频谱比较的热图示意如下
个突变频谱的比较,结果包含以下4个部分
用散点图的形式展示突变频率在两种频谱频谱中的分布,结果示意如下
计算两种频谱中的频率比值的对数,大于0代表在一组中高表达,小于0代表在另一组中高表达,用柱状图的形式展示log ratio的值,结果示意如下
将两种频谱的柱状图放在一起,便于比较,结果示意如下
结果示意如下
除此之外,官网还支持上传VCF文件,计算突变频谱等功能,更多用法请参考官网的帮助文档。
关于“mutagene是什么数据库”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。