这篇文章主要讲解了“Python怎么处理杂乱无序的数据”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么处理杂乱无序的数据”吧!
这个问题算是群友答疑
。如果说同事或者老板给你一堆这样的数据,你估计会抓狂
,该怎么处理呢?
仔细观察上面数据可以发现,该数据有如下2个主要特点
:
你可能会想,直接用Excel分裂
。其实并不可行,因为不同行的属性值,并不是对应排列。Excel分列导致的结果就是
:不同的属性,存在于相同的行。
放弃Excel那条路之后,我就只能寻求Python的帮助
了。我们要根据数据的特点,选择合适的数据存储方法。最终问题就转化为
:构造数据源,然后创建DataFrame即可。
然后根据我们这个数据的特点,我选择构造字典组成的列表
这样一个数据,并利用它来创建DataFrame。
观察我提供的这个案例和待解决的问题,简直异曲同工
。我们同样可以将上述数据的每一行,都变成一个个键值对组成的字典
。然后最外层用一个大列表
,将所有的字典包含起来。
import pandas as pd
x = {"信息":["年龄:12;性别:女;身高:22;爱好:打球",
"年龄:12;说明:历史数据;性别:女;身高:22;爱好:打球",
"生日:2月3日;年龄:12;性别:女;爱好:打球"]
}
df = pd.DataFrame(x)
df
结果如下:
tmps_list = []
for data in df["信息"].values:
tmp_dict = {}
for kv in data.split(";"):
k, v = kv.split(":")
tmp_dict[k] = v
tmps_list.append(tmp_dict)
tmps
结果如下:
df = pd.DataFrame(tmps)
df
结果如下:
感谢各位的阅读,以上就是“Python怎么处理杂乱无序的数据”的内容了,经过本文的学习后,相信大家对Python怎么处理杂乱无序的数据这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。