温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

R语言绘制分布曲线的方法是什么

发布时间:2021-11-22 15:48:57 来源:亿速云 阅读:170 作者:iii 栏目:大数据

本篇内容介绍了“R语言绘制分布曲线的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

 数据已经存储到了文件里 首先是读取数据
library(readr)
df<-read_tsv("author_number.tsv")
head(df)
 
R语言绘制分布曲线的方法是什么  
image.png
 期刊分别是
table(df$journal)
 
R语言绘制分布曲线的方法是什么  
image.png

我们先来看一下帮助文档中的例子

df_1 <- data.frame(
  x = c(rnorm(100, 0, 3), rnorm(100, 0, 10)),
  g = gl(2, 100)
)
p1<-ggplot(df_1, aes(x)) + stat_ecdf(geom = "step")

# Don't go to positive/negative infinity
p2<-ggplot(df_1, aes(x)) + stat_ecdf(geom = "step", pad = FALSE)

# Multiple ECDFs
p3<-ggplot(df_1, aes(x, colour = g)) + stat_ecdf()


library(patchwork)

p1+p2+p3
 
R语言绘制分布曲线的方法是什么  
image.png

这里新学到一个函数gl(),生成因子数据,比如

gl(2, 8, labels = c("Control", "Treat"))
 
R语言绘制分布曲线的方法是什么  
image.png

参数的意思是

  • 两种因子,每种8个,总共重复一次,因子的标签是 Control 和 Treat

之前我实现这个都是用rep()函数

再来一个例子

gl(2, 1, 20)
 
R语言绘制分布曲线的方法是什么  
image.png

两个因子,每种一个,重复20次

 接下来用作者数据试试
ggplot(df, aes(x=auth_num, col=journal)) + 
  stat_ecdf(geom="smooth", se=F, size=1.2) + 
  theme_bw() +
  scale_x_log10(breaks=c(1:5, seq(10, 50, by=10),
                         100, 200, 300,400,500)) +
  theme(legend.position=c(.75,.33),
        panel.grid = element_blank()) +
  labs(x="Number of authors per paper", 
       y="ECDF",
       col="") + 
  coord_cartesian(xlim=c(1,500)) +
  scale_color_brewer(type="qual", palette=6)
 
R语言绘制分布曲线的方法是什么  
image.png

“R语言绘制分布曲线的方法是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI