Python 正则表达式提取文本中的时间信息

使用 Python 正则表达式提取文本中包含年份、月份和日期的时间信息。

示例：

假设要从以下文本中提取时间信息：

'确认原告谷志欣与被告河南安飞电子玻璃有限公司自二○○三年四月起至二○一三年四月二十八日期间存在劳动关系'

可以使用以下代码：

import re

text = '确认原告谷志欣与被告河南安飞电子玻璃有限公司自二○○三年四月起至二○一三年四月二十八日期间存在劳动关系'

pattern = r'[一-龥]+(\d{4}年\d{1,2}月\d{1,2}日)[一-龥]+'
match = re.search(pattern, text)

if match:
    print(match.group(1))

输出结果为：

二○一三年四月二十八日

正则表达式解释：

[\u4e00-\u9fa5]+ 匹配一个或多个汉字
(\d{4}年\d{1,2}月\d{1,2}日) 匹配一个时间，由四位数字年份、一到两位数字月份和一到两位数字日期组成，中间用年、月、日分隔，使用括号将其捕获为一个分组
[\u4e00-\u9fa5]+ 匹配一个或多个汉字

因为正则表达式中使用了中文字符，所以需要在代码文件头部添加 # -*- coding: utf-8 -*- 来指定编码方式。