在Python中,使用正则表达式可以方便地从字符串中提取所需的信息。以下是一些基本步骤和示例:
re
模块:import re
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
re.findall()
函数来查找所有匹配的字符串:text = "这里有两个电子邮件地址:example1@gmail.com 和 example2@yahoo.com"
matches = re.findall(pattern, text)
print(matches) # 输出:['example1@gmail.com', 'example2@yahoo.com']
pattern = r'\b\(?\d{3}\)?[-.\s]?\d{3}[-.\s]?\d{4}\b'
re.finditer()
函数可以找到一个迭代器,其中包含所有匹配的字符串及其位置信息:for match in re.finditer(pattern, text):
print(match.group(), match.start(), match.end())
re.sub()
函数:replacement = "REPLACED"
new_text = re.sub(pattern, replacement, text)
print(new_text)
这只是Python正则表达式的基本用法。正则表达式有很多高级功能,可以让你更精确地匹配和处理字符串。你可以查阅Python的re
模块文档以了解更多信息。