这篇文章主要为大家展示了“如何通过Python爬取NBA湖人队球员薪资并进行分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“如何通过Python爬取NBA湖人队球员薪资并进行分析”这篇文章吧。
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
下面通过Python爬取NBA湖人队球员薪资并进行分析,代码如下:
1import pandas as pd
2import matplotlib.pyplot as plt
3df = pd.DataFrame()
4url_list = ['http://www.espn.com/nba/salaries/_/seasontype/4']
5for i in range(2, 13):
6 url = 'http://www.espn.com/nba/salaries/_/page/%s/seasontype/4' % i
7 url_list.append(url)
8# 遍历网页中的table读取网页表格数据
9for url in url_list:
10 df = df.append(pd.read_html(url), ignore_index=True)
11# 列表解析:遍历dataframe第3列,以子字符串$开头
12df = df[[x.startswith('$') for x in df[3]]]
13# 筛选"湖人队"
14df1=df[df[2]=='Los Angeles Lakers']
15df2=df1.copy() # 拷贝一个副本
16df2[3]=df2[3].map(lambda a: a.replace('$', '')) # 将薪资中的“$”去掉
17df2[3]=df2[3].apply(lambda x: float(x.replace(",", "")))
18print(df2)
19# 新增一列
20df2['中文名']=['勒布朗-詹姆斯','安东尼-戴维斯','丹尼-格林','肯塔维厄斯-考德威尔-波普','埃弗里-布拉德利','贾维尔-麦基','德文泰-卡考克','奎因-库克','亚历克斯-卡鲁索','拉简-隆多','凯尔-库兹马','马基夫-莫里斯','贾里德-杜德利','德怀特-霍华德','大卫-斯托克顿']
21df2.to_excel('NBA1.xlsx',header=['RK','NAME','TEAM','SALARY','中文名'], index=False)
22df3=df2.sort_values(by=3,ascending=True) # 降序排序
23fig=plt.figure(figsize=(8,4)) # 画布大小
24plt.subplots_adjust(left=0.3) # 调整图表空白处
25plt.rcParams['font.sans-serif']=['SimHei'] # 解决中文乱码
26plt.ticklabel_format(useOffset=False, style='plain') # 禁止科学计数法
27plt.title('NBA 湖人队球员薪资现状分析',fontsize='18') # 图表标题
28plt.xlim(800000,40000000)
29x=df3['中文名']
30y=df3[3]
31median=df3[3].median()
32plt.barh(x,y,label='薪资',color='r')
33# 薪资中位数参考线
34plt.axvline(median,color='blue',linestyle='--',)
35plt.show()
以上是“如何通过Python爬取NBA湖人队球员薪资并进行分析”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
原文链接:https://my.oschina.net/u/4848094/blog/4745626