本篇内容介绍了“怎么用R语言统计相同ID出现的频率”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
R语言代码,统计向量的频次,其实很简单,用table方法一步就完成,后面就是绘图了:
注意本代码的主题为cowplot主题适合SCI文章发表,并设置了柱状图上加数字。
library(reshape2) local({r <- getOption("repos") ;r["CRAN"] <- "http://mirrors.tuna.tsinghua.edu.cn/CRAN/" ;options(repos=r)}) library(ggplot2) library(cowplot) library(RColorBrewer) pairjoin <- function(x){ ran=x ran[length(ran)]=">=11" ran=ran[-1] ran } #统计频率,并把大于11的 归类到一起: data=table(data) data[data>10]=11 MassStatN <- with(hist(data, breaks=seq(0, 11, by = 1), plot=FALSE), data.frame(N=counts, Mass=pairjoin(breaks), PCT=counts/sum(counts))) MassStatN MassStatN$Mass=factor(MassStatN$Mass,levels = MassStatN$Mass,order=T) pn=ggplot(data=MassStatN, aes(x=Mass, y=N)) + geom_bar(fill="#4DAF4A",alpha = .9, stat="identity",width=0.8) + geom_text(aes(x=Mass,y=N+20,label=N))+ guides(fill=FALSE)+ theme(legend.key = element_blank(),legend.title = element_blank() )+ xlab("Peptide number")+ylab("Protein number") +ggtitle("Peptide number distribution") pn
“怎么用R语言统计相同ID出现的频率”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。