这篇“Pandas类型转换astype()如何实现”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Pandas类型转换astype()如何实现”文章吧。
Python中和Pandas中数据类型对应关系如下:
果数据是纯净的数据,可以转化为数字
astype基本也就是两种用作,数字转化为单纯字符串,单纯数字的字符串转化为数字,含有其他的非数字的字符串是不能通过astype进行转化的。
需要引入其他的方法进行转化,也就有了下面的自定义函数方法
astype()是最常见也是最通用的数据类型转换方法
import pandas as pd df = pd.DataFrame([['liver','E',89,21,24,64], ['Arry','C',36,37,37,57], ['Ack','A',57,60,18,84], ['Eorge','C',93,96,71,78], ['Oah','D',65,49,61,86] ], columns = ['name','team','Q1','Q2','Q3','Q4']) res = df.dtypes df.Q1.astype('int32').dtypes # dtype('int32') df.astype({'Q1':'int32','Q2':'int32'}).dtypes
结果展示
df
res
# 以下是一些使用示例: df.index.astype('int64') # 索引类型转换 df.astype('int32') # 所有数据转换为int32 df.astype({'col1':'int32'}) # 指定字段转指定类型 s.astype('int64') s.astype('int64',copy = False) # 不与原数据关联 df['name'].astype('object') data['Q4'].astype('float') s.astype('datatime64[ns]') # 转为时间类型 data['状态'].astype('bool')
数据类型
df.dtypes会返回每个字段的数据类型及DataFrame整体的类型
如果是Series,需要用s.dtype
import pandas as pd df = pd.DataFrame([['liver','E',89,21,24,64], ['Arry','C',36,37,37,57], ['Ack','A',57,60,18,84], ['Eorge','C',93,96,71,78], ['Oah','D',65,49,61,86] ], columns = ['name','team','Q1','Q2','Q3','Q4']) df.dtypes s = pd.Series(['One','Two','Three']) s.dtype
结果展示
df
s
当数据的格式不具备转换为目标类型的条件时,需要先对数据进行处理
例如“89.3%”是一个字符串,要转换为数字,要先去掉百分号:
# 将"89.3%"这样的文本转为浮点数 data.rate.apply(lambda x:x.replace('%','')).astype('float')/100
加载数据时可以指定数据各列的类型:
import pandas as pd # 对所有字段指定统一类型 df = pd.DataFrame(data, dtype = 'float32') # 对每个字段分别指定 df = pd.read_excel(data, dtype = {'team':'string','Q1':'int32'})
以上就是关于“Pandas类型转换astype()如何实现”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。