这篇文章主要介绍python去除非中文的方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
python去除非中文的方法:
import re def find_chinese(file): pattern = re.compile(r'[^\u4e00-\u9fa5]') chinese = re.sub(pattern, '', file) print(chinese) def find_unchinese(file): pattern = re.compile(r'[\u4e00-\u9fa5]') unchinese = re.sub(pattern,"",file) print(unchinese) if __name__ == "__main__": line = "2019年1月3日 - python去除空格和换行符的方法 一、去除空格 strip().strip() # ...用replace('\',''),后边的串替换掉前边的posted @ 2016-07-18 08:53 ..." print("原文:") print(line) print("保留中文:") find_chinese(line) print("保留非中文:") find_unchinese(line)
运行结果:
原文: 2019年1月3日 - python去除空格和换行符的方法 一、去除空格 strip().strip() # ...用replace('',''),后边的串替换掉前边的posted @ 2016-07-18 08:53 ... 保留中文: 年月日去除空格和换行符的方法一去除空格用后边的串替换掉前边的 保留非中文: 201913 - python 、 strip().strip() # ...replace('',''),posted @ 2016-07-18 08:53 ...
以上是python去除非中文的方法的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。