温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

python数据处理的方法

发布时间:2022-05-09 14:21:30 阅读:151 作者:iii 栏目:大数据
Python开发者专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

本篇内容主要讲解“python数据处理的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python数据处理的方法”吧!

df.query 过滤数据

0.25 版本开始支持 query 方法,可读性上又获得大幅提升,类似 sql 查询数据的写法,更加人性化。

下面举例说明,过滤数据常用三种方法。

df = pd.DataFrame({'A':np.random.randint(1,20,(8,)),                   'B':np.random.randint(1,20,(8,)),                   'C':np.random.randint(1,20,(8,))})df 
python数据处理的方法  

过滤条件:A列值大于其平均值,且 B列值大于 5 的行

方法 1

df[ (df['A'] > df["A"].mean()) & (df['B'] > 5)]

注意,& 前后必须要各自加一对 ()

方法 2

cr1 = df['A'] > df["A"].mean()cr2 = df['B'] > 5df[cr1 & cr2] 

方法 3

mean = df["A"].mean()df.query("A > @mean & B > 5")

query 是今天重点提到的,使用语法规则见上,变量前添加 @。这种语法的可读性大家觉得怎么样?

顺便提一下,如果列的名称中间有空格,有一个特别的语法,使用一对 `` 符号来标记列名:

df = pd.DataFrame({'First Name':['Jack','Mary','Mike']})df.query('`First Name` == \'Jack\'')

以上三种方法得到结果都为:

python数据处理的方法    

快速找出最多的分类

首先读入数据:

df = pd.read_csv("IMDB-Movie-Data.csv")df
python数据处理的方法

1000 行数据,genre 取值的频次统计如下:

vc = df["genre"].value_counts()vc 

打印结果:

Action,Adventure,Sci-Fi       50Drama                         48Comedy,Drama,Romance          35Comedy                        32Drama,Romance                 31                              ..Adventure,Comedy,Fantasy       1Biography,History,Thriller     1Action,Horror                  1Mystery,Thriller,Western       1Animation,Fantasy              1Name: genre, Length: 207, dtype: int64 

筛选出 top3 的 index:

top_genre = vc[0:3].indexprint(top_genre) 

打印结果:

Index(['Action,Adventure,Sci-Fi''Drama''Comedy,Drama,Romance'], dtype='object')

使用得到的 top3 的 index ,结合 isin,选择出相应的 df

df_top = df[df["genre"].isin(top_genre)]df_top

结果:

python数据处理的方法

到此,相信大家对“python数据处理的方法”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

原文链接:https://my.oschina.net/u/4585819/blog/4401065

AI

开发者交流群×