这篇文章主要介绍Pandas中apply函数怎么用,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
使用apply拆分文本
Pandas 中 apply 函数,应用广泛,今天要跟大家分享一个使用的技巧,使用 apply 将 dataframe 中内容为 list 的列拆分为多列。
拆分前的数据情况,如下图红色标注所示:
拆分后,如下图所示:
这个案例中,Lemon 使用的数据来自 akshare ,在开始前,引入相关 package :
# -*- coding: utf-8 -*- """ @Author: Lemon @出品:Python数据之道 @Homepage: liyangbit.com """ import numpy as np import pandas as pd import akshare as ak
Lemon 使用的几个 Python 库的版本信息如下:
print('numpy版本:{}'.format(np.__version__)) print('pandas版本:{}'.format(pd.__version__)) print('akshare版本:{}'.format(ak.__version__)) # numpy版本:1.18.1 # pandas版本:1.0.3 # akshare版本:0.7.53
如果代码运行出现问题,请先检查下这几个Python库的版本是否与上面的一致
先从 akshare 获取需要的数据,分为两步,第一步是获取基金代码的列表,如下:
df = ak.fund_em_fund_name().head(20).tail(5) dfdf = df[['基金代码','基金简称']] print(df)
第二步是获取基金净值数据和净值日期,通过一个自定义函数来获取,自定义函数如下:
# 自定义函数只有一个参数的情形 # 获取基金单位净值以及净值日期 def get_mutual_fund(code): df = ak.fund_em_open_fund_info(fund=code, indicator="单位净值走势") dfdf = df[['净值日期', '单位净值','日增长率']] # df.columns = ['净值日期', '单位净值', 'equityReturn', 'unitMoney'] df['净值日期'] = pd.to_datetime(df['净值日期']) dfdf = df.sort_values('净值日期',ascending=False) unit_equity = df.head(1)['单位净值'].values[0] date_latest = df.head(1)['净值日期'].values[0] return [unit_equity, date_latest]
对于这个自定义函数,在 pandas 使用 apply 来应用自定义函数,这是使用 apply 的一种常用的方法,如下:
# 获取基金最新的单位净值和净值日期 df['tmp'] = df['基金代码'].apply(get_mutual_fund) print(df)
获取的数据截图如下:
文本拆分
上图中的 tmp 列,就是我们这次需要进行处理的对象。
处理方法可以有多种,这里 Lemon 使用 pandas 中的 apply 来处理,相对来说,也是比较便捷的方式。
在 apply 函数中,使用 pd.Series 就可以达到我们的目的。
# 将单位净值和净值日期单独成列 df[['最新单位净值','净值日期']] = df['tmp'].apply(pd.Series) dfdf = df.drop('tmp',axis=1) print(df)
结果如下:
以上是“Pandas中apply函数怎么用”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。