这篇文章给大家分享的是有关怎么用R包STRINGdb来进行蛋白互作网络分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
采用R包STRINGdb 来进行蛋白互作网络分析
差异分析完成之后,可以做一个蛋白互作网络分析,看看差异蛋白只能有那些基因间存在相互作用。
实现这样的目标,方法有多种。一般比较常见的是采用STRING 这个网站,在网站上分析。其实采用R包STRINGdb也可以实现。代码参考如下:
############################################################ # 安装STRINGdb 软件包 # source("https://bioconductor.org/biocLite.R") # biocLite("STRINGdb") ############################################################ library(STRINGdb) # 设置程序参数 work_dir <- "/Users/zhangqiuxue/Documents/Train/TCGA/lab/PPI" deg_file <- "/Users/zhangqiuxue/Documents/Train/TCGA/lab/DEG/DE_genes.txt" setwd(work_dir) # 获取物种的分类编号 # get_STRING_species(version="10", species_name=NULL) # 9606 代表人类 string_db <- STRINGdb$new(version="10", species=9606, score_threshold=700, input_directory= work_dir) # 读取差异表达的文件,获得差异表达基因列表 degs = read.table(deg_file,header=T,comment.char = "",check.names=F) degs$gene <- rownames(degs) head(degs) # 查看有多少差异表达的基因需要分析 cat("Total deg genes:", dim(degs)[1]) # 将基因的ID map 到string 数据库中, 不一定每个基因都能map上 deg_mapped <- string_db$map( degs, "gene", removeUnmappedRows = TRUE ) # 查看有多少ID map 上了 cat("Total String id mapped :", dim(deg_mapped)[1]) # 设置绘图相关的参数 options(SweaveHooks=list(fig=function() par(mar=c(2.1, 0.1, 4.1, 2.1)))) # 筛选出一部分结果,进行绘图 hits <- deg_mapped$STRING_id[1000] # 绘图 string_db$plot_network( hits,required_score =700) # 将所有的结果输出到文件,后面采用cytoscape 进行网络分析 info <- string_db$get_interactions(deg_mapped$STRING_id) write.table(info, file = "STRING_info.txt",sep="\t", row.names =F, quote = F) # 采用igraph 进行聚类分析 clustersList <- string_db$get_clusters(deg_mapped$STRING_id) # 设置绘图参数 options(SweaveHooks=list(fig=function() par(mar=c(2.1, 0.1, 4.1, 2.1)))) # 绘制前4个聚类图 par(mfrow=c(2,2)) for(i in seq(1:4)){ string_db$plot_network(clustersList[[i]]) }
感谢各位的阅读!关于“怎么用R包STRINGdb来进行蛋白互作网络分析”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。