这期内容当中小编将会给大家带来有关pandas中怎么求平均数和中位数,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
pandas是一个强大的Python数据分析的工具包。
pandas是基于NumPy构建的。
pandas的主要功能
具备对其功能的数据结构DataFrame、Series
集成时间序列功能
提供丰富的数学运算和操作
灵活处理缺失数据
本文用到的表格内容如下:
先来看一下原始情形:
import pandas as pd df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df)
result:
分类 货品 实体店销售量 线上销售量 成本 售价
0 水果 苹果 34 234 12 45
1 家电 电视机 56 784 34 156
2 家电 冰箱 78 345 24 785
3 书籍 python从入门到放弃 25 34 13 89
4 水果 葡萄 789 56 7 398
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df.mean())
result:
实体店销售量 196.4
线上销售量 290.6
成本 18.0
售价 294.6
dtype: float64
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df.mean(axis=1))
result:
0 81.25
1 257.50
2 308.00
3 40.25
4 312.50
dtype: float64
先看运行结果,我们可以看到,每一行求平均数的时候直接忽略文本字符类型的列,只对数字类型的列进行求平均数。就比如第一行的数据
分类 货品 实体店销售量 线上销售量 成本 售价
0 水果 苹果 34 234 12 45
上面的81.25=(34+234+12+45) / 4,,其他的行也是如此
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df['实体店销售量'].mean())
result:
196.4
1.2.2 求取单独某一行的平均数
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df.iloc[[0]].mean())
result:
实体店销售量 34.0
线上销售量 234.0
成本 12.0
售价 45.0
dtype: float64
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df[['实体店销售量', "线上销售量"]].mean())
result:
实体店销售量 196.4
线上销售量 290.6
dtype: float64
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df.iloc[[0, 1]].mean())
result:
实体店销售量 45.0
线上销售量 509.0
成本 23.0
售价 100.5
dtype: float64
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df.median())
result:
实体店销售量 56.0
线上销售量 234.0
成本 13.0
售价 156.0
dtype: float64
可以看到,中位数的概念只对数字有效
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df.median(axis=1))
result:
0 39.5
1 106.0
2 211.5
3 29.5
4 227.0
dtype: float64
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df['实体店销售量'].median())
result:
56.0
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df.iloc[[0]].median())
result:
实体店销售量 34.0
线上销售量 234.0
成本 12.0
售价 45.0
dtype: float64
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df[['实体店销售量', "线上销售量"]].median())
result:
实体店销售量 56.0
线上销售量 234.0
dtype: float64
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx') print(df.iloc[[0, 1]].median())
result:
实体店销售量 45.0
线上销售量 509.0
成本 23.0
售价 100.5
dtype: float64
上述就是小编为大家分享的pandas中怎么求平均数和中位数了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。