python爬取网站数据，如何绕过反爬虫策略

发布时间：2020-07-10 13:40:27 阅读：977 作者：156881887 栏目：编程语言

Python开发者专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

1、使用session对象

session = requests.session()
strhtml = session.get(url) #与当前网站的首次会话

2、设置headers

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                         "Chrome/69.0.3497.100 Safari/537.36",
           "Accept": "application/json"}
session.headers = headers

3、设置cookies

设置与网站首次会话时的cookies为默认的cookies

cookies = session.cookies
session.headers.setdefault('cookies', cookies)

此后，可以复用之前会话中的cookies了

strhtml2 = session.get(url2)

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

python爬取网站数据，如何绕过反爬虫策略

猜你喜欢

最新资讯

相关推荐

开发者交流群：

相关标签