这篇文章主要介绍了pd.DataFrame如何统计各列数值是多少,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
如下所示:
.count() #非空元素计算 .min() a #最小值 .max() #最大值 .idxmin() #最小值的位置,类似于R中的which.min函数 .idxmax() #最大值的位置,类似于R中的which.max函数 .quantile(0.75) #75%分位数 .sum() #求和 .mean() #均值 .median() #中位数 .mode() #众数 .var() #方差 .std() #标准差 .mad() #平均绝对偏差 .skew() #偏度 .kurt() #峰度 .describe() #一次性输出多个描述性统计指标
如果你想统计各个列大于0的元素个数:
data[data>0].count()
会出现各个属性(列)大于零的个数
data[data['A']>0].count()
列A大于0的个数
这里说明,data的数据格式必须是DataFrame
pd.Series().value_counts(),会统计各个类的统计值。
我们在用这些函数时,会迷茫,不知道什么时候value_counts(),什么时候count()
这和前面的数据形式是有关的,只要前面是Series数据,要用value_counts(),前面数据形式是DataFrame要用count()
感谢你能够认真阅读完这篇文章,希望小编分享的“pd.DataFrame如何统计各列数值是多少”这篇文章对大家有帮助,同时也希望大家多多支持亿速云,关注亿速云行业资讯频道,更多相关知识等着你来学习!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。