温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

怎么用python爬取喜马拉雅全站音频

发布时间:2021-07-13 15:23:13 来源:亿速云 阅读:308 作者:chen 栏目:大数据

       喜马拉雅FM是一个知名的音频分享平台,在移动音频行业的市场占有率已达73%,用户规模突破4.8亿,今晚我们就带大家突破层层障碍,探秘喜马拉雅的天籁之音,实现实时抓捕并保存到本地。

怎么用python爬取喜马拉雅全站音频

      开发环境:Windows 、pycharm 、 requests 、 json

       知识点:

       1、网络反爬技术

       2、文件操作

       3、数据转换

       4、字典、字符串、列表数据类型的使用

       同样,我们要求使用火狐浏览器或者Google浏览器;我们接下来要确定几件事:

        1、确定网址(喜马拉雅网址)

        2、网络请求获取数据(点开我们想要的音频)

        3、数据筛选(筛选我们想要的音频)

        4、保存数据(保存我们需要的音频)

 

怎么用python爬取喜马拉雅全站音频

部分程序如下:

url = “https://www.ximalaya.com/revision/play/album?albumId=291718&psgeNum=1&sort=1&page”

response = requests.get(url,headers=header).text

audio_data = json.loads(response)[“data”][“tracksAudioPlay”]

for audio_in   in audio_data:

    music_url = audio_info[“src”]

    “https://fdfs.xmcdn.com/group61/M05/70/C1/wKgMcFoJCZuw9cSkAB9RrgvYaVU283.m4a”

     music_name = music_url.split(“/”)[-1]

.....

怎么用python爬取喜马拉雅全站音频

      完整视频关注公众号(自学的仙叔)或者扫描下面二维码,在公众号中回复“喜马拉雅”拿取资源。

怎么用python爬取喜马拉雅全站音频


本文分享自微信公众号 - 自学的仙叔(gh_3de5e20d92e5)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI