温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何用R对连续数据做描述统计

发布时间:2022-01-06 09:14:00 来源:亿速云 阅读:209 作者:柒染 栏目:大数据

这篇文章将为大家详细讲解有关如何用R对连续数据做描述统计,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

用R做基本描述统计,可选的函数很多,反而显得不那么直接。挑选着学习几个好用的能满足日常分析需求即可。

函数使用


自带summary()
pastecs包stat.desc()

案例数据

employee雇员数据,下载数据自由练习。

如何用R对连续数据做描述统计

练习1

对整个数据集进行描述统计。

   
   
   summary(employee)

结果:

如何用R对连续数据做描述统计

显然这并不是我们想要的,一些分类变量并不适合用summary函数。

练习2

指定单一变量做描述统计

   
   
   summary(employee["salary"])

结果:

如何用R对连续数据做描述统计

练习3

指定多个变量做描述统计

   
   
   summary(employee[c("salary","salbegin")])

结果:

如何用R对连续数据做描述统计

练习4

指定多个变量做描述统计

   
   
   stat.desc(employee[c("salbegin","salary")],norm = T)

结果:

如何用R对连续数据做描述统计

stat.desc()函数使用格式为:
stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)

如何用R对连续数据做描述统计

其中的x是一个数据框或时间序列。

若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。若desc=TRUE(默认值),则计算中位数、平均数、平均数的标准误、平均数95%的置信区间、方差、标准差以及变异系数。若norm=F(默认值),则不返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果。

关于如何用R对连续数据做描述统计就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI