Python中怎么利用Mitmproxy爬取公众号文章

发布时间：2021-07-10 11:25:37 阅读：252 作者：Leah 栏目：大数据

Python开发者专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

Python中怎么利用Mitmproxy爬取公众号文章，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

将手机端的代理IP设为pc端的IP地址

当我们安装好证书后，就可以进行如下操作。首先在pc端的开始栏输入cmd，然后输入控制命令ipconfig，查看pc端的IP地址，如下图；

Python中怎么利用Mitmproxy爬取公众号文章

然后在手机端的所连接的wifi选项中打开代理ip手动设置，用户名填入IPv4地址，端口一般设为8080即可。

爬取文章阅读信息

完成上述操作后，我们就进行py代码的如下操作。

代码修改操作

在参考博客中我们只需要修改wxCrawler.py这个py代码即可，其余代码均可不必修改，因为该代码是爬取文章的关键。我们将wxCrawler.py代码的爬取链接改为爬取到的文章的阅读信息即可；wxCrawler.py在for循环处导入参考博客text_01.py代码类传入相应的参数，(参考博客为articles.py代码)；只做这一处修改即可完成爬取公众号文章阅读信息。

text_01.py代码

Python中怎么利用Mitmproxy爬取公众号文章