strip_tags和正则表达式可以配合使用来过滤HTML标签以及其他特定的文本格式。下面是一个示例代码,演示如何结合使用strip_tags和正则表达式来过滤HTML标签:
import re
def remove_html_tags(text):
cleaned_text = strip_tags(text) # 去除HTML标签
cleaned_text = re.sub(r'<.*?>', '', cleaned_text) # 去除其他特定格式的文本,如<>中的内容
return cleaned_text
html_text = "<p>Hello, <strong>world!</strong></p>"
cleaned_text = remove_html_tags(html_text)
print(cleaned_text) # Output: Hello, world!
在这个示例中,首先使用strip_tags函数去除HTML标签,然后使用正则表达式<.*?>
来匹配并去除<>中的内容,最终得到清理后的文本。通过结合使用strip_tags和正则表达式,可以更好地过滤文本中的特定格式内容。