这篇文章给大家分享的是有关Python如何使用execjs执行包含中文参数的JavaScript的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
抓取到了一段包含数据的JavaScript代码:
import re
import requests
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36",
"accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
}
res = requests.get(
"https://www.kuaikanmanhua.com/web/comic/100868/",
headers=headers
)
script = re.findall(
"<script>window.__NUXT__=([^<]+);</script>", res.text)[0].replace('\\u002F', "/")
script
结果:
这段代码直接在游览器执行可以得到对应的JSON数据,那么我们如何使用python执行这段代码获取JS数据呢?答案是使用execjs。
安装:
pip install PyExecJS
但是如果此时在安装过Nodejs的windows上直接执行代码:
import execjs
execjs.eval(script)
会报出如下错误:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 447: illegal multibyte sequence
此时我们需要重新指定execjs的环境为JScript:
import os
os.environ["EXECJS_RUNTIME"] = "JScript"
再次执行可以顺利得到结果。
如果我们确实需要使用本地nodejs的环境执行JavaScript则需要修改修改execjs的源码:
import os
os.environ["EXECJS_RUNTIME"] = "Node"
print(execjs.get().name)
Node.js (V8)
找到execjs安装目录下的_external_runtime.py
文件:
重启程序再次执行即可得到结果:
execjs的调用函数或读取变量示例:
import execjs
ctx = execjs.compile("""
function add(x, y) {
return x + y;
}
v = add(3, 4);
""")
print(ctx.call("add", 1, 2), ctx.eval("v"))
3 7
Lib\site-packages\execjs\runtime_names.py
文件可以看到execjs所支持的JavaScript环境:
PyV8 = "PyV8"
Node = "Node"
JavaScriptCore = "JavaScriptCore"
SpiderMonkey = "SpiderMonkey"
JScript = "JScript"
PhantomJS = "PhantomJS"
SlimerJS = "SlimerJS"
Nashorn = "Nashorn"
感谢各位的阅读!关于“Python如何使用execjs执行包含中文参数的JavaScript”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。