jquery怎么爬取页面数据

发布时间：2022-03-05 10:22:48 来源：亿速云阅读：392 作者：iii 栏目：web开发

本篇内容主要讲解“jquery怎么爬取页面数据”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“jquery怎么爬取页面数据”吧!

　　搭建环境：

　　（1）、创建一个文件夹，进入并初始化一个package.json文件。

　　npm init -y

　　（2）、安装相关依赖：

　　npm install --save koa? ? npm install --save cheerio //后面会用到，用于抓取页面模块，为服务器特别定制的，快速、灵活、实施的jQuery核心实现

　　现在来一个简单的demo热热身。直接上代码（文件名：demo2.js）：

　　var http=require（'http'） // Node.js提供了http模块，用于搭建HTTP服务端和客户端

　　var url='' //输入任何网址都可以

　　http.get（url,function（res）{ //发送get请求

　　var html=''

　　res.on（'data',function（data）{

　　html +=data //字符串的拼接

　　}）

　　res.on（'end',function（）{

　　console.log（html）

　　}）

　　}）。on（'error',function（）{

　　console.log（'获取资源出错！'）

　　}）

　　执行node demo2.js? ?得到结果如下：

　　很神奇有木有。然而这不是我们想要的，我们想要的是获取页面里面某一部份的数据。

　　这里以没事影院的电视剧页面为例。这时候cheerio就派上用场了，前面已经安装过，这里就不再赘述，它的用法其实跟jquery是很相似的。参考？cheerio（百度百科的解释）

　　在刚刚的js文件中引入cheerio模块，然后加载所需要的html内容。

　　var $=cheerio.load（html）？ // 加载需要的html

　　为了方便使用，这里封装一个函数：

　　functionfilterChapters（html） {var $=cheerio.load（html） //加载需要的html，然后就可以愉快地使用类似jQuery的语法了

　　var chapters=$（'.movie-item'） //在html里寻找需要的资源的class

　　var courseData=[] //创建一个数组，用来保存资源

　　chapters.each（function（item, index） { //遍历我们的html文档

到此，相信大家对“jquery怎么爬取页面数据”有了更深的了解，不妨来实际操作一番吧！这里是亿速云网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

向AI问一下细节

猜你喜欢