温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

R语言的ssGSEA.r怎么使用

发布时间:2022-03-21 09:45:06 来源:亿速云 阅读:527 作者:iii 栏目:开发技术

本文小编为大家详细介绍“R语言的ssGSEA.r怎么使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“R语言的ssGSEA.r怎么使用”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

ssGSEA.r  单样本基因集富集分析

使用方法:

$Rscript ../scripts/ssGSEA.r -h
usage: ../scripts/ssGSEA.r [-h] -i expset -g geneset [-o outdir] [-p prefix]
ssGSEA免疫侵润分析
optional arguments:
  -h, --help            show this help message and exit
  -i expset, --expset expset
                        input gene expression set matrix from RNA-seq data csv
                        format [required]
  -g geneset, --geneset geneset
                        input gene set database [required]
  -o outdir, --outdir outdir
                        output file directory [default cwd]
  -p prefix, --prefix prefix
                        output file name prefix [default demo]

参数说明:

-i 基因表达量  , 建议用TPM标准化之后的数据:

IDTCGA-D7-A74A-01A-11R-A32D-31TCGA-BR-7704-01A-11R-2055-13TCGA-VQ-A91N-01A-11R-A414-31TCGA-CD-A4MH-01A-11R-A251-31
NUP5018.6550531.5923228.2338228.76485
CXCR464.85805125.12356.3524469.98976
NT5E111.481869.858779.3738225.05824
EFNA38.24785742.0330843.4643226.66024
STC14.78111121.3632740.8107719.51568
ZBTB7A95.51678103.4768158.3024126.2677
CLDN91.1874562.4761380.3660817.347344

-g 基因集  两列数据,第一列细胞类型,第二列为基因

CellTypeSymbol
B cellsMS4A1
B cellsTCL1A
B cellsMS4A1
B cellsTCL1A
B cellsHLA-DOB
B cellsPNOC
B cellsKIAA0125
B cellsCD19
B cellsCR2
B cellsIGHG1
B cellsFCRL2
B cellsBLK
B cellsIGHG1
B cellsCOCH
B cellsOSBPL10
B cellsIGHA1
B cellsTNFRSF17
B cellsABCB4
B cellsBLNK

结果说明:

得到每一个样本的不同基因集中的NES值: 

NES值:用最大值与最小值间的绝对差对ssGSEA分数进行标准化。

cell_typeTCGA-B7-A5TK-01A-12R-A36D-31TCGA-BR-7959-01A-11R-2343-13TCGA-IN-8462-01A-11R-2343-13TCGA-BR-A4CR-01A-11R-A24K-31
aDC0.6121305110.4527214220.4340650.352635
B cells0.4233227750.4088700640.4266120.413857
Blood vessels0.681023490.7754385720.6894330.577667
CD8 T cells0.6756153850.6500732420.6291210.566048
Cytotoxic cells0.6210561510.4252174420.4116170.3128
DC0.6198389250.4850555790.4891010.266905
Eosinophils0.5027849490.5149385570.4695410.488051
iDC0.5316197560.498437210.5309310.390699
Lymph vessels0.7108427690.7213230720.6583910.500574

方法说明:

单样本基因集富集分析(single sample gene set enrichment analysis, ssGSEA),是GSEA方法的扩展,主要是针对单个样本无法做GSEA而设计。文章2009年发表于nature,题目为Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1。

首先对给定样本的基因表达值进行秩次标准化,然后利用经验累积分布函数计算富集分数(ES)。设给定基因集为G,包含基因数为NG,给定单个样本为S,表达谱包含基因数为N,N个基因按它们绝对表达值从高到低确定秩次。i 从1赋值到N,依此计算PGw和PNG。

读到这里,这篇“R语言的ssGSEA.r怎么使用”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI