这篇文章给大家分享的是有关python怎么去除删除数据中\u0000\u0001等unicode字符串的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
py文件为utf-8格式
#!/usr/bin/env python # -*- coding:utf-8 -*- a = "system\u0000" b = re.sub(u'\u0000', "", a) print(b) ## b="system"
补充知识:Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符
【背景】
类似于:
\u3232\u6674 的字符串,转换为对应的unicode字符。
【解决过程】
对应的,可以通过Python的decode函数去解码,其中自定原始字符串位unicode-ecape,就可以了。
完整的python代码演示为:
#!/usr/bin/python #coding: utf-8 slashUStr = "\\u0063\\u0072\\u0069\\u0066\\u0061\\u006E\\u0020\\u5728\\u8DEF\\u4E0A"; #crifan 在路上 decodedUniChars = slashUStr.decode("unicode-escape") print "decodedUniChars=",decodedUniChars; #decodedUniChars= crifan 在路上
感谢各位的阅读!关于“python怎么去除删除数据中\u0000\u0001等unicode字符串”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。