本篇文章为大家展示了R语言计算一组数据的置信区间并画密度图进行可视化展示的示例分析,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
我看了StatQuest 介绍置信区间的那一期视频,大体理解了,但是让我用语言表述出来,还有点不知道如何表达。本来B站可以直接看StatQuest的视频的,今天看到B站的up主发消息说StatQuest的原作者准备入驻B站了,所以他把原来获得授权的那些视频全都删掉了。所以要在B站看这些视频还要等一阵子了。
今天的主要内容来自 How to Calculate Confidence Interval in R : Statistics in R : Data Sharkie
计算置信区间用到的函数是CI()
函数,来自R语言包Rmisc
R语言包Rmisc
第一次使用需要先安装
install.packages("Rmisc")
计算某组数据均值95%的置信区间
x<-iris$Sepal.Length
library(Rmisc)
CI(x,ci=0.95)
返回的结果是
> CI(x,ci=0.95)
upper mean lower
5.976934 5.843333 5.709732
前面提到的参考链接里有一句话
Logically, as you increase the sample size, the closer is the value of a sample parameter to a population parameter, therefore the narrower the confidence interval gets. 样本越大,样本的均值越接近总体的均值,所以均值的置信区间就会越窄
ggplot2画密度分布图按取值范围填充不同的颜色
下面使用ggplot2画密度图展示并且展示均值95%的置信区间
#install.packages("Rmisc")
library(Rmisc)
x<-iris$Sepal.Length
library(Rmisc)
x1<-CI(x,ci=0.95)
class(x1[1])
dat<-with(density(x),data.frame(x,y))
dat1<-dat[dat$x>x1[3]&dat$x<x1[1],]
library(ggplot2)
ggplot(iris,aes(Sepal.Length))+
geom_density(fill="grey")+
geom_vline(xintercept = x1[1],lty="dashed")+
geom_vline(xintercept = x1[3],lty="dashed")+
geom_area(data=dat1,aes(x=x,y=y),fill="red")+
geom_vline(xintercept = x1[2],lty="dashed")+
scale_y_continuous(expand = c(0,0),
limits = c(0,0.41))+
theme_minimal()
上述内容就是R语言计算一组数据的置信区间并画密度图进行可视化展示的示例分析,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。