想问大家一个问题啊,大家学习 Python爬虫 的动力是什么呀?
下面是我们有些同学的回答:
1 . Python爬虫 学好了,我可以找一个高薪的工作。
2 .我学习编程希望能够为社会做贡献(手动滑稽)
3 .为了姑娘!(很直白的回答哈!)
.....
总结了一些同学的回答,结论大多是爬取一切自己想看想了解的事情和人(姑娘)!果然还是姑娘让我们这些码农有动力啊!
今天咱们就是爬取今日头条,你要问我为什么要爬取今日头条?是因为爱嘛?
是因为责任嘛?
不,是因为头条里面的有很多美女图片,然后我们可以把她们都爬取下来!!!
是不是想想都觉得很兴奋,是不是都要流鼻血了?!
下面我们要做的就是用Python爬虫把上面的图片给爬下来。
开始分析网站
按下f 12,然后点击network,刷新下你可以看到这些
在网页上可以看到图片会随着你下拉网页而进行显示更多的图片。
今日头条的网站是动态加载的,其实可以很轻松的就可以在xhr的文件里面找到。
不断地发送请求,点击这个请求看看是返回什么数据
可以看到这是个json,里面有图片的url,这个就是我们要找的东西。
我们可以用json库来解析,还有这个网站是get请求,这样就可以用requests库来发送然后解析下就可以了,非常简单。
代码:需要完整的代码可以关注后私信【爬取头条】即可获取
最后给你们看下结果
文章中如果有哪些地方如有错误或者不足,欢迎在留言区指出,欢迎大家的监督。更多相关的 Python爬虫 教程也会继续为大家更新!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。