温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何利用Python网络爬虫获取旅游景点信息

发布时间:2021-10-19 10:14:48 来源:亿速云 阅读:282 作者:柒染 栏目:大数据

今天就跟大家聊聊有关如何利用Python网络爬虫获取旅游景点信息,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

爬虫系列:

当我们出去旅游时,会看这个地方有哪些旅游景点,景点价格、开放时间、用户的评论等。

如何利用Python网络爬虫获取旅游景点信息  
 

1、项目目标

获取网站的景点名称、开放时间、精彩点评、价格等信息。

 

2、涉及的库和网站

先列出网址,如下所示:

网址:https://go.hao123.com/ticket?city=%E5%B9%BF%E5%B7%9E&theme=all&pn=1
 

网址city=%E5%B9%BF%E5%B7%9E指的是广州这个城市、pn指的是页数。

需要用到的库:requests、lxml、pprint

 

3、具体实现

  1. 导入我们需要的库
import requestsfrom lxml import etreefrom pprint import pprint
 
  1. 导入库之后,我们定义一个class类,然后定义一个init方法继承self再定义一个主函数main,定义一个init方法:首先准备url地址,headers,如下图所示。
如何利用Python网络爬虫获取旅游景点信息  
  1. 定义一个请求函数,获取响应数据函数:
如何利用Python网络爬虫获取旅游景点信息  
  1. 请求到数据后,我们需要把这个数据进行解析:
如何利用Python网络爬虫获取旅游景点信息  
  1. 获取景点名称二级页面链接:使用xpath查找链接路径用谷歌浏览器选择开发者工具或者按F12,选择Elements按数字1、2操作找到旅游景点名称二级页面链接。
如何利用Python网络爬虫获取旅游景点信息  
  1. 根据分析,我们可以撸下代码。
如何利用Python网络爬虫获取旅游景点信息  
  1. 获取二级页面链接后,发送请求获取响应,解析数据。定义一个字典,保存景点名称、开放时间、精彩点评、价格。使用判断语句判断里面内容是否是空的。
如何利用Python网络爬虫获取旅游景点信息  
  1. 最后定义一个main函数,如下图所示。
如何利用Python网络爬虫获取旅游景点信息  
 

4、效果展示

点击绿色按钮运行,将结果显示在控制台,如下图所示。输入你要爬取的页数。

如何利用Python网络爬虫获取旅游景点信息  
 

5、小结

  1. 不建议抓取太多数据,容易对服务器造成负载,浅尝辄止即可。

  2. 希望通过这个项目,能够帮助大家更好的了解旅游景点。

  3. 欢迎大家积极尝试,有时候看到别人实现起来很简单,但是到自己动手实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。

看完上述内容,你们对如何利用Python网络爬虫获取旅游景点信息有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注亿速云行业资讯频道,感谢大家的支持。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI