温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Python正则表达式-基础

发布时间:2020-07-26 22:24:50 来源:网络 阅读:295 作者:Osheep 栏目:开发技术

本文转载自昔日暖阳,原文地址:http://www.osheep.cn/4806.html

python使用正则,需要先引入re模块

import re

匹配符

单个字符表达式 含义
[0-9] 0123456789任意之一
[a-z] 小写字母任意之一
[A-Z] 大写字母任意之一
\d 等同于[0-9]
\D 等同于[^0-9]匹配非数字,即\d的取反
\w 等同于[a-z0-9A-Z_]匹配大小写字母、数字和下划线
\W 等同于[^a-z0-9A-Z_]等同于上一条取反
. 一个任意字符

匹配模式

匹配模式表达式 含义
? 指定字符一次或者不出现
+ 至少出现一次
* 出现任意次,包括不出现
^ 从字符串开头进行匹配
$ 匹配到字符串的结尾
() 分组符、也可用于或匹配

案例一:匹配邮箱

  • 匹配126,163邮箱地址
# 匹配126,163邮箱地址
ret = re.match(r"^[0-9a-zA-Z_]{4,20}@(163|126)\.com$", 'hello@126.com')
if ret:
    print('符合要求 - ', ret.group(), ret.group(1))
else:
    print('不符合要求!')

案例二:匹配邮箱并进行分组取值

  • 匹配126,163邮箱地址
# 使用()对匹配值进行分组,可以方便的取得匹配值
# 分组1表示@前面的字符串
# 分组2表示163或者126
ret = re.match(r"^([0-9a-zA-Z_]{4,20})@(163|126)\.com$", 'hello@126.com')
if ret:
    print('符合要求 - ', ret.group(), ret.group(1), ret.group(2))
else:
    print('不符合要求!')

案例三:在正则表达式中使用分组

  • 匹配网页源代码块
# 在正则表达式中使用分组
# 使用\分组数表示需要使用的分组
ret = re.match(r"^<(\w+)>.*</(\1)>$", '<h2>hello</h2>')
if ret:
    print('符合要求 - ', ret.group())
else:
    print('不符合要求!')
  • 使用多个分组
# 在正则表达式中使用分组
# 使用\分组数表示需要使用的分组,这里表示多个分组
ret = re.match(r"^<(\w+)><(\w+)>.*</(\2)></(\1)>$", '<body><h2>hello</h2></body>')
if ret:
    print('符合要求 - ', ret.group())
else:
    print('不符合要求!')

案例四:在正则表达式中对分组进行命名

  • 对分组进行命名 语法:标记分组 ?P<name> 引用分组 ?P=name
# 在正则表达式中使用分组
# 使用\分组数表示需要使用的分组,这里表示多个分组
ret = re.match(r"^<(?P<p1>\w+)><(?P<p2>\w+)>.*</(?P=p2)></(?P=p1)>$", '<body><h2>hello</h2></body>')
if ret:
    print('符合要求 - ', ret.group())
else:
    print('不符合要求!')
向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI