温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Python如何爬取NBA虎扑球员数据

发布时间:2021-10-26 09:38:56 来源:亿速云 阅读:294 作者:柒染 栏目:大数据

这篇文章给大家介绍Python如何爬取NBA虎扑球员数据,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

虎扑是一个认真而有趣的社区,每天有众多JRs在虎扑分享自己对篮球、足球、游戏电竞、运动装备、影视、汽车、数码、情感等一切人和事的见解,热闹、真实、有温度。

受害者地址

https://nba.hupu.com/stats/players

Python如何爬取NBA虎扑球员数据

本文知识点:

  • 系统分析网页性质

  • 结构化的数据解析

  • csv数据保存

环境介绍:

  • python 3.6

  • pycharm

  • requests

  • csv

爬虫案例的一般步骤

  • 1.确定url地址(网页分析) 完成一半

  • 2.发送网络请求 requests(js\html\css)

  • 3.数据解析(筛选数据)

  • 4.保存数据(本地文件\数据库)

部分代码

导入工具

import requests  # 第三方工具
import parsel  # 数据解析工具  (css\正则表达式\xpath)
import csv

确定url地址(网页分析) 完成一半 (静态网页\动态网页)

url = 'https://nba.hupu.com/stats/players/pts/{}'.format(page)

发送网络请求 requests(js\html\css)

response = requests.get(url=url)
html_data = response.text

数据解析(筛选数据)

selector = parsel.Selector(html_data)
    trs = selector.xpath('//tbody/tr[not(@class="color_font1 bg_a")]')
    for tr in trs:
        rank = tr.xpath('./td[1]/text()').get()  # 排名
        player = tr.xpath('./td[2]/a/text()').get()  # 球员
        team = tr.xpath('./td[3]/a/text()').get()  # 球队
        score = tr.xpath('./td[4]/text()').get()  # 得分
        hit_shot = tr.xpath('./td[5]/text()').get()  # 命中-出手
        hit_rate = tr.xpath('./td[6]/text()').get()  # 命中率
        hit_three = tr.xpath('./td[7]/text()').get()  # 命中-三分
        three_rate = tr.xpath('./td[8]/text()').get()  # 三分命中率
        hit_penalty = tr.xpath('./td[9]/text()').get()  # 命中-罚球
        penalty_rate = tr.xpath('./td[10]/text()').get()  # 罚球命中率
        session = tr.xpath('./td[11]/text()').get()  # 场次
        playing_time = tr.xpath('./td[12]/text()').get()  # 上场时间
        print(rank, player, team, score, hit_shot, hit_rate, hit_three,
              three_rate, hit_penalty, penalty_rate, session, playing_time)

        data_dict = {
            '排名': rank, '球员': player, '球队': team, '得分': score,
            '命中-出手': hit_shot, '命中率': hit_rate, '命中-三分': hit_three, '三分命中率': three_rate,
            '命中-罚球': hit_penalty, '罚球命中率': penalty_rate, '场次': session, '上场时间': playing_time}

        csv_write.writerow(data_dict)
				
        #  想要完整源码的同学可以关注我的公众号:松鼠爱吃饼干
        #  回复“虎扑NBA”即可免费获取

运行代码,效果如下

Python如何爬取NBA虎扑球员数据

关于Python如何爬取NBA虎扑球员数据就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI