温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

怎么编写Python爬虫爬取B站小视频的源码

发布时间:2021-10-19 09:17:53 来源:亿速云 阅读:148 作者:柒染 栏目:大数据

今天就跟大家聊聊有关怎么编写Python爬虫爬取B站小视频的源码,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

如果要爬取多页的话 在最下方循环中 填写好循环的次数就可以了

项目源码

from fake_useragent import UserAgentimport requestsimport time
ua=UserAgent()

def downloader(url, path):    start = time.time()   # 开始时间    size = 0    headers = {        'User-Agent':ua.random    }    response = requests.get(url, headers=headers, stream=True)   # stream 属性必须带上    chunk_size = 1024    # 每次下载的数据大小    content_size = int(response.headers['content-length'])   # 总大小    if response.status_code == 200:        print('[文件大小]:%0.2f MB' % (content_size / chunk_size / 1024))   # 换算单位        with open(path, 'wb') as file:            for data in response.iter_content(chunk_size=chunk_size):                file.write(data)                size += len(data)   # 已下载的文件大小                print('\r' + '[下载进度]:%s%.2f%%' % ('>' * int(size * 50 / content_size), float(size / content_size *                                                                                             100)), end=" ")    end = time.time()    # 结束时间    print('\n' + '视频下载完成!用时%.2f秒' % (end - start))


def The_URL(page):    URL='http://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset={}&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc'.format(page)    headers={        'User-Agent':ua.random    }    sponse=requests.get(URL,headers=headers).json()    item=sponse.get('data').get('items')    for i in item:        ite=i.get('item')        #视频标题        Video_name=ite.get('description')
       #发布日期        Release_time=ite.get('upload_time_text')
       #视频下载地址        Video_download_link=ite.get('video_playurl')
       #视频作者        The_name=i.get('user').get('name')
       try:            print('当前下载的是:%s'%Video_name)            downloader(Video_download_link,path='%s.mp4'%Video_name)        except Exception as e:            print(e.args)
for i in range(0,100):    i=i*10+1    The_URL(i)

看完上述内容,你们对怎么编写Python爬虫爬取B站小视频的源码有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注亿速云行业资讯频道,感谢大家的支持。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI