本篇内容介绍了“怎么用R语言统计相同ID出现的频率”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
R语言代码,统计向量的频次,其实很简单,用table方法一步就完成,后面就是绘图了:
注意本代码的主题为cowplot主题适合SCI文章发表,并设置了柱状图上加数字。
library(reshape2)
local({r <- getOption("repos") ;r["CRAN"] <- "http://mirrors.tuna.tsinghua.edu.cn/CRAN/" ;options(repos=r)})
library(ggplot2)
library(cowplot)
library(RColorBrewer)
pairjoin <- function(x){
ran=x
ran[length(ran)]=">=11"
ran=ran[-1]
ran
}
#统计频率,并把大于11的 归类到一起:
data=table(data)
data[data>10]=11
MassStatN <- with(hist(data, breaks=seq(0, 11, by = 1), plot=FALSE),
data.frame(N=counts, Mass=pairjoin(breaks), PCT=counts/sum(counts)))
MassStatN
MassStatN$Mass=factor(MassStatN$Mass,levels = MassStatN$Mass,order=T)
pn=ggplot(data=MassStatN, aes(x=Mass, y=N)) +
geom_bar(fill="#4DAF4A",alpha = .9, stat="identity",width=0.8) +
geom_text(aes(x=Mass,y=N+20,label=N))+
guides(fill=FALSE)+
theme(legend.key = element_blank(),legend.title = element_blank()
)+ xlab("Peptide number")+ylab("Protein number") +ggtitle("Peptide number distribution")
pn
“怎么用R语言统计相同ID出现的频率”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。