怎样使用python网络爬虫抓取视频

发布时间：2020-11-12 09:49:15 阅读：433 作者：小新栏目：编程语言

Python开发者专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

小编给大家分享一下怎样使用python网络爬虫抓取视频，希望大家阅读完这篇文章后大所收获，下面让我们一起去探讨吧！

准备工作：

l Chrome 浏览器、

l Vim

l Python3 开发环境

l Kali Linux

API 寻找 && 提取

1、我们通过 F12 打开开发者模式。

怎样使用python网络爬虫抓取视频

2、再查看一下 Headers 属性

3、再看下看到Request URL这个属性值

代码实现

写好脚本，利用爬虫下载片断

##导入的两个模块，其中requests模块需要自行下载
from multiprocessing import Pool
import requests
##定义一个涵数
def demo(i):
    ##定义了一个url,后面%3d就是截取后面三位给他加0，以防止i的参数是1的时候参数对不上号，所以是1的时候就变成了001
    url="https://vip.okokbo.com/20180114/ArVcZXQd/1000kb/hls/phJ51837151%03d.ts"%i
    ##定义了请求头信息
    headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36"}
    ##构建自定义请求对象
    req=requests.get(url,headers=headers)
    ##将文件保存在当前目录的mp4文件中，名字以url后十位数起名
    with open('./mp4/ {}'.format(url[-10:]), 'wb') as f:
        f.write(req.content)
 
##程序代码的入口
if __name__=='__main__':
    ##定义一个进程池，可以同时执行二十个任务，不然一个一个下载太慢
    pool = Pool(20)
    ##执行任务的代码
    for i in range(100):
        pool.apply_async(demo, (i,))
 
    
    pool.close()
pool.join()