温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何进行PyQuery理论分析

发布时间:2021-12-04 16:08:46 来源:亿速云 阅读:124 作者:柒染 栏目:大数据

这期内容当中小编将会给大家带来有关如何进行PyQuery理论分析,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

    hello,各位小伙伴,大家好,上次我们是了解到了html的基础知识,那有人就有疑问了,我是查看到了html上的信息了,我想获取了,但是如何才能把其上面的我想要的信息给拿下来呢?有什么工具吗?嗯,说明这位同学还是很爱思考的,目前我们市面上可以获取html的相关工具是非常多的,目前工业界用的比较多的是:BeautifulSoup、xpath、 pyquery。今天我们介绍的是pyquery 这个也是我在工作中用的最多的一款工具,可以说是非常的得心应手。好,接下来我们就来了解一下这个工具。

介绍

      pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,官方文档地址是:http://packages.python.org/pyquery/

  pyquery 可让你用 jQuery 的语法来对 xml 进行操作。这I和 jQuery 十分类似。如果利用 lxml,pyquery 对 xml 和 html 的处理将更快。

  这个库不是(至少还不是)一个可以和 JavaScript交互的代码库,它只是非常像 jQuery API 而已。

 

安装

  pip install pyquery

      或下载安装:https://pypi.python.org/pypi/pyquery/#downloads

 

初始化


  引入库:from pyquery import PyQuery as pq

  1、直接字符串

  doc=pq("<html></html>")   pq 参数可以直接传入 HTML 代码,doc 现在就相当于 jQuery 里面的 $ 符号了

  2、lxml.etree

  doc=pq(etree.fromstring("<html></html>"))

  可以首先用 lxml 的 etree 处理一下代码,这样如果你的 HTML 代码出现一些不完整或者疏漏,都会自动转化为完整清晰结构的 HTML代码。

  3、直接传URL

doc=pq('http://www.baidu.com')

  这里就像直接请求了一个网页一样,类似用 urllib2 来直接请求这个链接,得到 HTML 代码

  4、传文件

  doc=pq(filename='hello.html')

  可以直接传某个路径的文件名。

上述就是小编为大家分享的如何进行PyQuery理论分析了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI