Python 正则表达式提取文本中的时间信息
使用 Python 正则表达式提取文本中包含年份、月份和日期的时间信息。
示例:
假设要从以下文本中提取时间信息:
'确认原告谷志欣与被告河南安飞电子玻璃有限公司自二○○三年四月起至二○一三年四月二十八日期间存在劳动关系'
可以使用以下代码:
import re
text = '确认原告谷志欣与被告河南安飞电子玻璃有限公司自二○○三年四月起至二○一三年四月二十八日期间存在劳动关系'
pattern = r'[一-龥]+(\d{4}年\d{1,2}月\d{1,2}日)[一-龥]+'
match = re.search(pattern, text)
if match:
print(match.group(1))
输出结果为:
二○一三年四月二十八日
正则表达式解释:
[\u4e00-\u9fa5]+匹配一个或多个汉字(\d{4}年\d{1,2}月\d{1,2}日)匹配一个时间,由四位数字年份、一到两位数字月份和一到两位数字日期组成,中间用年、月、日分隔,使用括号将其捕获为一个分组[\u4e00-\u9fa5]+匹配一个或多个汉字
因为正则表达式中使用了中文字符,所以需要在代码文件头部添加 # -*- coding: utf-8 -*- 来指定编码方式。
原文地址: https://www.cveoy.top/t/topic/oAW7 著作权归作者所有。请勿转载和采集!