Python 正则表达式去除 HTML 标签
可以使用以下 Python 代码去除 HTML 标签:
import re
text = '<p>Hello, world!</p>'
cleaned_text = re.sub('<[^<]+?>', '', text)
print(cleaned_text)
输出:
Hello, world!
上述代码中,正则表达式 '<[^<]+?>' 匹配所有以 '<' 开头,以 '>' 结尾的字符串,并将其替换为空字符串,从而达到去除 HTML 标签的目的。
原文地址: https://www.cveoy.top/t/topic/loId 著作权归作者所有。请勿转载和采集!