温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

pandas怎么实现按照Series分组

发布时间:2021-08-09 02:09:59 来源:亿速云 阅读:137 作者:chen 栏目:开发技术

本篇内容介绍了“pandas怎么实现按照Series分组”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

目录
  • 1 按照一个Series进行分组

  • 2 按照多个Series进行分组

  • 3 分组和聚合采用不同的列或Series进行

本文用到的表格内容如下:

pandas怎么实现按照Series分组

先来看一下数据情形

import pandas as pd
life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df)

result:
      分类  编号    名称
0     水果   0    苹果
1     水果   1    橙子
2   生活用品   2    牙刷
3   生活用品   3    冰箱
4   生活用品   4   电视机
5     食物   0    苹果
6     食物   1    橙子
7     家电   3    冰箱
8     家电   4   电视机
9     大件   3    冰箱
10    大件   4   电视机
11    大件   5    茶几
12  生活用品   7  暖手宝宝
13  小说   8   红楼梦

将DataFrame的其中一列取出来就是一个Series,比如life_df["分类"]就是一个Series

1 按照一个Series进行分组

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分类"]))

result:

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001506806C6C8>

从上面的结果可以看出,如果只是传入Series,分组后的结果是一个DataFrameGroupBy对象。这个对象包含着分组以后的若干组数据,但是没有直接显示出来,需要对这些分组数据进行汇总计算以后才会显示出来

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分类"]).count())

result:
  编号  名称

分类          
大件     3   3
家电     2   2
小说     1   1
水果     2   2
生活用品   4   4
食物     2   2

上面的代码是根据物品分类对所有数据进行了分组,然后对分组以后的数据分别进行计数运算,最后进行合并。

由于对分组后的数据进行了计数运算,因此每一列都会有一个结果。但是如果对分组后的结果做一些数值运算,这个时候只有数据类型是数值(int、float)的列才会参与运算

import pandas as pd
life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分类"]).sum())

result:
      编号

分类      
大件    12
家电     7
小说     8
水果     1
生活用品  16
食物     1

我们把这种对分组后的数据进行汇总运算的操作称为聚合,使用的函数称为聚合函数。比如前面系列文章提高的非空值计数、sum求和、最大值最小值、均值、中位数、众数、方差、标准差和分位数这些。都属于聚合函数。

2 按照多个Series进行分组

多Series分组和单Series分组差不多,只要将多个Series以列表的形式传递给groupby()即可。

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby([life_df["分类"], life_df["名称"]]).count())

result:
       编号

分类   名称      
大件   冰箱     1
     电视机    1
     茶几     1
家电   冰箱     1
     电视机    1
小说   红楼梦    1
水果   橙子     1
     苹果     1
生活用品 冰箱     1
     暖手宝宝   1
     牙刷     1
     电视机    1
食物   橙子     1
     苹果     1

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby([life_df["分类"], life_df["名称"]]).sum())

result:
       编号

分类   名称      
大件   冰箱     3
     电视机    4
     茶几     5
家电   冰箱     3
     电视机    4
小说   红楼梦    8
水果   橙子     1
     苹果     0
生活用品 冰箱     3
     暖手宝宝   7
     牙刷     2
     电视机    4
食物   橙子     1
     苹果     0

3 分组和聚合采用不同的列或Series进行

这里和按列分组的用法一致

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分类"])["名称"].count())

result:
分类
大件      3
家电      2
小说      1
水果      2
生活用品    4
食物      2
Name: 名称, dtype: int64

这里就是按照物品分类进行分组,再按照物品名称进行汇总统计

“pandas怎么实现按照Series分组”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI