这篇“怎么用R包mclust对样本进行聚类”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“怎么用R包mclust对样本进行聚类”文章吧。
$Rscript ../scripts/mclust_analysis.r -h usage: ../scripts/mclust_analysis.r [-h] -i gene_data -m metadata [--mclust] [-g group] [-n model_name] [-o outdir] [-p prefix] mclust analysis:https://www.亿速云.com/article/1580 optional arguments: -h, --help show this help message and exit -i gene_data, --gene_data gene_data input data file path[required] -m metadata, --metadata metadata input clinical information file path[required] --mclust whether to cluster the samples[optional,default:False] -g group, --group group Group the samples into several categories[optional,default:3] -n model_name, --model_name model_name input the model category to use[optional,default:VVE] -o outdir, --outdir outdir output file directory[optional,default cwd] -p prefix, --prefix prefix out file name prefix[optional,default metadata]
-i 输入基因的表达数据:
ID | TCGA-A3-3319-01A-02R-1325-07 | TCGA-A3-3323-01A-02R-1325-07 |
YTHDC2 | 16.5128725081007 | 20.6535652352011 |
ELAVL1 | 44.3876796198438 | 31.8729000784291 |
-m 输入样本的临床信息:
barcode | patient | TCGA_Study |
TCGA-A3-3319-01A-02R-1325-07 | TCGA-A3-3319 | KIRC |
TCGA-A3-3323-01A-02R-1325-07 | TCGA-A3-3323 | KIRC |
--mclust 是否对样本进行聚类
第一次运行脚本不进行聚类,通过返回的BIC(贝叶斯信息判别标准)结果选择合适的聚类数和模型类别
-n 输入选择的模型类别
mclust包中提供了14种模型(EII、VII、EEI、VEI、EVI、VVI、EEE、EVE、VEE、VVE、EEV、VEV、EVV、VVV)
-g 输入合适的聚类数
#第一次运行不指定g和n,通过BIC结果选择合适的g和n
$Rscript ../scripts/mclust_analysis.r -i m6a_gene_TPM.tsv -m ../metadata_surv_immu.tsv
#再次运行指定g和n,进行聚类
Rscript ../scripts/mclust_analysis.r -i m6a_gene_TPM.tsv \ -m ../metadata_surv_immu.tsv --mclust -g 3 -n VVE
以上就是关于“怎么用R包mclust对样本进行聚类”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。