使用python爬虫如何实现快速响应服务器

发布时间：2020-11-25 15:04:21 阅读：205 作者：Leah 栏目：开发技术

这期内容当中小编将会给大家带来有关使用python爬虫如何实现快速响应服务器，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

requests之所以称为“HTTP for human”，因为其封装层次很高，其中一处体现就在：requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候，搜狗搜索列表页面的公众号文章地址，其实不是微信的地址而需要请求到搜狗到服务器做重定向，而requests的默认处理则是将整个过程全部搞定，对此可以这样：

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外，有时候对方网站的响应时间太长了，我们希望在指定时间内完事，或者直接停止这个请求，这时候的做法是：

In [1]: r = requests.get('http://xlzd.me', timeout＝3)

timeout表示这次请求最长我最长只等待多少秒

拓展：

为requests套上一层代理的做法也非常简单：

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

上述就是小编为大家分享的使用python爬虫如何实现快速响应服务器了，如果刚好有类似的疑惑，不妨参照上述分析进行理解。如果想知道更多相关知识，欢迎关注亿速云行业资讯频道。

向AI问一下细节

使用python爬虫如何实现快速响应服务器

猜你喜欢

最新资讯

相关推荐

相关标签