小编给大家分享一下python读txt乱码怎么办,相信大部分人都还不怎么了解,因此分享这边文章给大家学习,希望大家阅读完这篇文章后大所收获,下面让我们一起去学习方法吧!
从报错讲起:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 2: illegal multibyte sequence
出现这个错误一般是由于打开文件时,没有指定编码引起的,比如下面代码
with open('../corpus.txt', mode = 'r') as f:
解决方法很简单,为其指定编码就行了
with open('../corpus.txt', encoding='utf-8', mode = 'r') as f:
还有一个常见的问题就是,生成txt文件,查看内容时发现乱码,这可能与你在打开文件时没有指定编码方式有关
代码就像这样
output = open('context.txt', 'w')
解决的方式也很简单,只要在打开文件时,指定文件编码就行了
output = open('context.txt', 'w', encoding="utf-8")
以上是python读txt乱码怎么办的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。