作用:用正则表达式的字符分割字符串,正则的字符会被抛弃。
本文以 提取URL的地址与参数 为例,介绍re模块的split的用法: 返回值 -> 列表
复杂匹配 = re.compile(正则表达式): 将正则表达式实例化
+
re.split(要匹配的字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回
简单匹配 = re.split(正则表达式, 要匹配的原字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回
懒癌,配上模块函数解释好消化
re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,则返回一个列表,否则返回原string列表; 第一个参数:正则表达式 第二个参数:要匹配查找的原始字符串; 第三个参数:可选参数,表示最大的拆分次数,默认为0,表示全部分割; 第四个参数:可选参数,标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等; 需要特别注意的是,这个方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符,仍然视为成功。想要完全匹配,可以在表达式末尾加上边界匹配符'$' 例如: re.split(‘z’, ‘p.python.p’)返回值为['p.python.p']; #失败返回原string列表 re.split(‘p’, ‘p.python.p’)返回值为['', '.', 'ython.', ''] #成功返回新列表
方法一:
对象名1 = re.split(正则表达式, 要匹配的原字符串)
#!/usr/bin/python # -*- coding: utf-8 -*- import os,re; pattern = r'[?|&]' string = "https://www.baidu.com/baidu?&ie=utf-8&word=51cto" result = re.split(pattern, string) print('Match:',result)
运行结果:
Match: ['https://www.baidu.com/baidu', '', 'ie=utf-8', 'word=51cto']
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。