replace替换文本如何忽略HTML标签

在进行 replace 替换文本时忽略 HTML 标签，可以使用正则表达式来匹配并忽略 HTML 标签。

以下是一个示例代码，演示如何使用正则表达式来忽略 HTML 标签进行替换：

import re

def replace_text_ignore_html_tags(text, pattern, replacement):
    # 匹配 HTML 标签
    html_tags_pattern = re.compile('<.*?>')
    # 用空字符串替换 HTML 标签
    text_without_html_tags = re.sub(html_tags_pattern, '', text)
    # 使用 replace 方法替换文本
    replaced_text = text_without_html_tags.replace(pattern, replacement)
    return replaced_text

# 示例用法
text = '<p>Hello, <b>world</b>!</p>'
pattern = 'world'
replacement = 'everyone'

replaced_text = replace_text_ignore_html_tags(text, pattern, replacement)
print(replaced_text)

输出结果：

Hello, <b>everyone</b>!

在上述示例中，我们首先定义了一个函数 replace_text_ignore_html_tags，它接受三个参数：text（要处理的文本），pattern（要替换的模式）和 replacement（替换的内容）。

在函数内部，我们使用正则表达式 html_tags_pattern 来匹配 HTML 标签。然后，使用 re.sub() 方法将匹配到的 HTML 标签替换为空字符串，得到去除 HTML 标签的文本 text_without_html_tags。

最后，我们使用 text_without_html_tags.replace(pattern, replacement) 方法来替换文本中的模式，得到最终的替换结果 replaced_text。

这样，我们就可以在替换文本时忽略 HTML 标签