今天小编给大家分享一下怎么用Python和R实现描述性统计的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。
描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,可以借助描述性统计来描述或总结数据的基本情况。
Python实现
from numpy import mean,median,ptp,var,stdimport numpy as npimport pandas as pd#算术平均值data = [1,2,3,4,5,5,5,6,7,8,8,9]data_mean = mean(data)print("算术平均数 = ")print(data_mean)#中位数data_median = median(data)print("中位数 = ")print (data_median)#众数data_mode = mode(data)print("众数 = ")print (data_mode)#极差data_range = max(data)-min(data)print("极差 = ")print (data_range)#方差和标准差data_var = var (data)print ("方差 = ")print (data_var)#标准差data_sd = std(data)print ("标准差 = " )print (data_sd)#变异系数data_cv = mean(data) / std(data)print ("变异系数 = " )print (data_cv)#四分卫极差dt = pd.Series(np.array([1,2,3,4,5,5,5,6,7,8,8,9]))print('Q1:', dt.quantile(.25))print('Q3:', dt.quantile(.75))print('Q3 - Q1 :', dt.quantile(.75) - dt.quantile(.25) )
R实现
#整理成描述性统计的函数my_describe <- function(x){ options(digits = 3) N = length(x); Min = min(x, na.rm = TRUE); Q1 = quantile(x, probs = 0.25, na.rm = TRUE); Median = median(x, na.rm = TRUE); Q3 = quantile(x, probs = 0.75, na.rm = TRUE); Max = max(x, na.rm = TRUE); Mean = mean(x, na.rm = TRUE); Var = var(x, na.rm = TRUE); Sd = sd(x, na.rm = TRUE); Range = abs(diff(range(x))); #返回结果 return(data.frame(N = N, Min = Min, Q1 = Q1, Median = Median, Q3 = Q3, Max = Max, Mean = Mean, Var = Var, Sd = Sd, Range = Range))}#可对data数据集批量使用sapply(data, my_describe)
以上就是“怎么用Python和R实现描述性统计”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。