小编给大家分享一下python中request请求乱码的解决方法,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
POST从网页中获取数据,由于编码问题,出现乱码。
方法:
``` response = session.get('http://xxxx') print(response.encoding) response.encoding = 'utf-8' print(response.json()) ```
原因:
1.因为数据源的编码声明不规范,导致reuqests无法判断出返回数据的正确编码,从而使用了它的默认编码 iso8859-1 来将数据转换
为 unicode,没使用正确的编码 utf-8,于是就出现乱码了。
解决办法一就是手动设置返回数据的正确编码:response.encoding = 'utf-8'。这样结果就是正确的 unicode 类型字符串。
或者将错误的 unicode 用同样的 iso8859-1 编码转换回去原本的 utf-8 编码的 str 类型字符串:data.encode('iso8859-1')。
2.(没明白,反正就这么个意思吧。编码真是个大坑!)Python中实际上有两种字符串,分别是str类型和unicode类型,这两者都是
basestring的派生类。str实际上相当于string, 而unicode则是标准的字符串,相当于wstring。
其中I/O读入的基本都是str类型,也就是说Python不关心这些字节代表什么含义。但是如果需要做真正的字符串操作的时候,建议使用
unicode类型,这样确保不存在编码问题。
JSON理论上应该可用ASCII完全表示,其中的宽字符用类似\u1111的形式表达。但是现在有很多不规范的JSON出现,例如s="""{"标题":
"Hello, world"}"""。此时就需要你自己确定这部分内容用字节表达时,究竟用了什么编码,如果是UTF-8,那么就首
s_u=s.decode("UTF-8")变成unicode字符串。
另一方面,只要保证这段字符串的编码和Python运行时环境的编码保持一致,也是可以直接loads(str类型变量)的。例如Linux下如果
LANG是UTF-8,那么python跑着的时候就可以直接把UTF-8编码的JSON串塞进去。
以上是python中request请求乱码的解决方法的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。