这篇文章主要讲解了“Python数据分析和机器学习实例代码分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python数据分析和机器学习实例代码分析”吧!
Python是一门动态的、面向对象的脚本语言,同时也是一门简约,通俗易懂的编程语言。Python入门简单,代码可读性强,一段好的Python代码,阅读起来像是在读一篇外语文章。Python这种特性称为“伪代码”,它可以使你只关心完成什么样的工作任务,而不是纠结于Python的语法。
另外,Python是开源的,它拥有非常多优秀的库,可以用于数据分析及其他领域。更重要的是,Python与最受欢迎的开源大数据平台Hadoop具有很好的兼容性。因此,学习Python对于有志于向大数据分析岗位发展的数据分析师来说,是一件非常节省学习成本的事。
Python的众多优点让它成为最受欢迎的程序设计语言之一,国内外许多公司也已经在使用Python,例YouTube,Google,阿里云等等。
经过这个月的python数据分析和机器学习,总结了一些经验,同时也收获了一些大佬的优秀博客,感兴趣的可以观看我的收藏夹,废话不多说,直接进入正题。
数据分析大致分为数据处理,模型建立,模型测试这3部,这篇文章主要是讲解对数据进行处理
为了对数据进行分析,首先要了解学习python的熊猫库pandas,下面是一些基础简单的操作方法,python调用方法如下
import pandas as pd
python通过pandas读取csv文件的方法
df= pd.read_csv("xxx.csv") #输出文件内容前五列 print(df.head()) #输出csv所有内容 print(df)
查看csv某列数据的方法
pandas.read_csv(‘file_name.csv", usecols = [0,1,2,3]) #简单方法 df["属性列名称"]
pandas删除csv数据某些列的方法
droplabels= ["x_cat4","x_cat5","x_cat8","x_cat9"] data=df.drop(droplabels,axis=1)
pandas对NAN数据清洗的方法
#将表格中含有nan数值的列进行删除,返回非空数据和索引值的Series df.dropna() """ dropna(axis=0,how="any",thresh=None),how参数可选的值为any或者all.all仅在切片元素全为NA时才抛弃该行(列)。thresh为整数类型,eg:thresh=3,那么一行当中至少有三个NA值时才将其保留。 """ data.fillna(0) #将nan替换为0 print(data.fillna(data.mean())) ### 用每列特征的均值填充缺失数据 print(data.fillna(data.median())) ### 用每列特征的中位数填充缺失数据 print(data.fillna(method="bfill")) ### 用相邻后面(back)特征填充前面空值 print(data.fillna(method="pad")) ### 用相邻前面特征填充后面空值 #参考博客:https://blog.csdn.net/qq_21840201/article/details/81008566
pandas对csv文件数据的更改的方法
#更改某列属性数值和类型 df = df[df["涨跌幅"]!="None"] df["涨跌幅"] = df["涨跌幅"].astype(np.float64) df = pd.DataFrame(a, dtype="float") #数据类型转化 #参考链接:http://www.45fan.com/article.php?aid=19070771581800099094144284 #对数据全部遍历读取并更改,参考如下 for i in df.index: df["id1"][i]=1
pandas的iloc的使用方法和作用
X = df.iloc[:, data.columns != "label"] # 取出不包括 label其他的列 df.iloc[:3, :2] #使用.iloc ,我们只选择了.iloc的前3行和2列
计算某列元素数量的方法
sum= len(data[data.label == "BENIGN"]) #计算BENIGN的数量 len(df)
pandas对文件进行保存的方法
#df为要保存的数据,xxx.csv为保存的文件 df.to_csv("xxx.csv", index=False, sep=",")
感谢各位的阅读,以上就是“Python数据分析和机器学习实例代码分析”的内容了,经过本文的学习后,相信大家对Python数据分析和机器学习实例代码分析这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。