Python中print如何正确使用,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
Python print会对输出的文本做自动的编码转换,而文件对象的write方法就不会做,因此,当一些字符串用print输出正常时,write到文件确不一定和print的一样。print转换的目的编码和环境变量有关,Windows XP是转换为gbk的。在linux下是按照环境变量来转换的。在linux下使用locale命令就可以看到。比如我的是:
[zhaowei@papaya zhaowei]$ locale LANG=zh_CN LC_CTYPE="zh_CN" LC_NUMERIC="zh_CN" LC_TIME="zh_CN" LC_COLLATE="zh_CN" LC_MONETARY="zh_CN" LC_MESSAGES="zh_CN" LC_PAPER="zh_CN" LC_NAME="zh_CN" LC_ADDRESS="zh_CN" LC_TELEPHONE="zh_CN" LC_MEASUREMENT="zh_CN" LC_IDENTIFICATION="zh_CN" LC_ALL=
这个时候会认为是gb2312的。在python中可以用locale模块来获得当前环境的编码:
import locale print locale.getdefaultlocale()
Python print在输出时把字符串自动装换为这个编码。看看下面,"喆"这个字是很著名的一个在gb2312中没有的字,当把它转换为gb2312的时候是会出错的。
#-*- encoding: gb18030 -*- import locale import sys, encodings, encodings.aliases # 现在a是unicode的 a = u'喆' print a.encode("gb2312")
上面这段代码会报异常,就是这个原因。但如果是直接 print a 就可以输出来 (假设你的环境变量是GBK或者GB18030或者UTF-8)。如果你的环境变量是GB2312的,那这个print一样会报错!所以在处理其他地方来 的文本数据时,***不要用GB2312的编码,是中文数据,一定要用GB18030或者UTF-8!
而用文件对象的write写unicode的数据也是会出错的!需要做编码转换
#-*- encoding: gb18030 -*- import locale import sys, encodings, encodings.aliases # 现在a是unicode的 a = u'喆' f = open("aaa.txt", "w") f.write(a) f.close()
看完上述内容,你们掌握Python中print如何正确使用的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注亿速云行业资讯频道,感谢各位的阅读!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。