这期内容当中小编将会给大家带来有关如何进行PyQuery理论分析,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
hello,各位小伙伴,大家好,上次我们是了解到了html的基础知识,那有人就有疑问了,我是查看到了html上的信息了,我想获取了,但是如何才能把其上面的我想要的信息给拿下来呢?有什么工具吗?嗯,说明这位同学还是很爱思考的,目前我们市面上可以获取html的相关工具是非常多的,目前工业界用的比较多的是:BeautifulSoup、xpath、 pyquery。今天我们介绍的是pyquery 这个也是我在工作中用的最多的一款工具,可以说是非常的得心应手。好,接下来我们就来了解一下这个工具。
pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,官方文档地址是:http://packages.python.org/pyquery/
pyquery 可让你用 jQuery 的语法来对 xml 进行操作。这I和 jQuery 十分类似。如果利用 lxml,pyquery 对 xml 和 html 的处理将更快。
这个库不是(至少还不是)一个可以和 JavaScript交互的代码库,它只是非常像 jQuery API 而已。
pip install pyquery
或下载安装:https://pypi.python.org/pypi/pyquery/#downloads
引入库:from pyquery import PyQuery as pq
1、直接字符串
doc=pq("<html></html>") pq 参数可以直接传入 HTML 代码,doc 现在就相当于 jQuery 里面的 $ 符号了
2、lxml.etree
doc=pq(etree.fromstring("<html></html>"))
可以首先用 lxml 的 etree 处理一下代码,这样如果你的 HTML 代码出现一些不完整或者疏漏,都会自动转化为完整清晰结构的 HTML代码。
3、直接传URL
doc=pq('http://www.baidu.com')
这里就像直接请求了一个网页一样,类似用 urllib2 来直接请求这个链接,得到 HTML 代码
4、传文件
doc=pq(filename='hello.html')
可以直接传某个路径的文件名。
上述就是小编为大家分享的如何进行PyQuery理论分析了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。