字符串处理
1,字符串分割
(a)split 方法
str1 = "http:// www.qwe, qwe; qwe,qwe" import re re.split(r'[,;\s]\s*',str1) >>> ['http://', 'www.qwe', 'qwe', 'qwe', 'qwe']
一般简单的可以使用 str.split("xxx")进行分割。但是re.split( ) 用起来更加的灵活。
2, 字符串开头和结尾
(a) str.startswith( )/str.endswith( )
filename = "http://zaixiankefu.txt" filename.endswith(".txt") >>>True filename.startswith("http:") >>>True # startswith( )和 endswith( )可以接收一个元组数据,注意是元组。 choice = (".txt",".avi") filename.endswith(choice) >>>True
(b) 也可以使用切片来判断
if filename[:4] == "http" and filename[-4:] == ".txt": return True
3,字符串匹配
简单的就是str.startswith( ),str.endswith( ),str.find(),前两种返回时bool 值,find是返回第一次匹配的下标值。
使用正则进行匹配(更多方法参考正则文档)。
(a)re.match( )
match 总是从字符串开始去匹配 。如匹配则返回一个匹配对象,失败返回None。
str1 = "2018/12/20" import re re.match(r'\d*/',str1) >>> <_sre.SRE_Match object; span=(0, 5), match='2018/'>
(b) re.search( )
search 会匹配整个字符串。如匹配则返回一个匹配对象,失败返回None。
re.search(r'/\d*/',str1) >>> <_sre.SRE_Match object; span=(4, 8), match='/12/'>
(c) re.findall( )
findall( )会匹配整个字符串,匹配则返回一个list列表,要么有值要么空
如果返回的值过多,可以使用 finditer( )来替代。
str1 = "www.baidu.com" import re re.finditer(r'w',str1) #会返回一个可迭代对象 >>> <callable_iterator at 0x5be230>
忽略大小写进行匹配
4,字符串替换
简单的替换可以使用 str.replace(old,new) 进行操作。
re.sub( )可以更加灵活处理。
反斜杠数字,例如 \3 指向前面模式的捕获组号。
5,字符串中插入变量
使用 format 和 format_map( ) + vars( )来进行处理。
vars( )实现的是在变量域中找到所需的变量。
缺点是,变量缺失后,会直接报错。如果变量未找到
可以使用类进行包装。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。