问题:我们需要在散沙一般的数据中提取出字符,分隔符不止一个,而且还有不少空格,比如:
原字符串如下:
'asd ff gg; asd , foo| og '
我们需要删除上面的,;|分隔符和多余空格,提取出:
['asd', 'ff', 'gg', 'asd', 'foo', 'og']
这种一般用于处理日志或者网页数据提取,一般而言,这种数据中需要的数据分布规律性不是太强,而且比较散。
处理结果如下:
import re line = 'asd ff gg; asd , foo| og ' data = re.split(r'[;,|\s]\s*',line) for i in data: if i == '': data.remove(i) print(data)
以上这篇python针对不定分隔符切割提取字符串的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持亿速云。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。