Python 正则表达式匹配中文文本

使用 Python 正则表达式可以方便地匹配中文文本。通过 Unicode 编码 '\p{Han}' 可以匹配所有汉字字符。

示例代码

import re

text = '这是一段中文文本。'
pattern = re.compile(r'\p{Han}')

matches = pattern.findall(text)
print(matches)  # ['这', '是', '一', '段', '中', '文', '文', '本']

在这个例子中，使用了 ' \p{Han} ' 表示匹配所有汉字。可以通过 findall 方法来找到所有匹配的字符串。