使用 Python 正则表达式提取文本中包含年份、月份和日期的时间信息。

示例:

假设要从以下文本中提取时间信息:

'确认原告谷志欣与被告河南安飞电子玻璃有限公司自二○○三年四月起至二○一三年四月二十八日期间存在劳动关系'

可以使用以下代码:

import re

text = '确认原告谷志欣与被告河南安飞电子玻璃有限公司自二○○三年四月起至二○一三年四月二十八日期间存在劳动关系'

pattern = r'[一-龥]+(\d{4}年\d{1,2}月\d{1,2}日)[一-龥]+'
match = re.search(pattern, text)

if match:
    print(match.group(1))

输出结果为:

二○一三年四月二十八日

正则表达式解释:

  • [\u4e00-\u9fa5]+ 匹配一个或多个汉字
  • (\d{4}年\d{1,2}月\d{1,2}日) 匹配一个时间,由四位数字年份、一到两位数字月份和一到两位数字日期组成,中间用年、月、日分隔,使用括号将其捕获为一个分组
  • [\u4e00-\u9fa5]+ 匹配一个或多个汉字

因为正则表达式中使用了中文字符,所以需要在代码文件头部添加 # -*- coding: utf-8 -*- 来指定编码方式。

Python 正则表达式提取文本中的时间信息

原文地址: https://www.cveoy.top/t/topic/oAW7 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录