推广正则表达式模式以从多个文档中查找不同的日期格式

时间:2018-12-28 04:20:37

标签: python-2.7

我对Python很陌生。我有一项任务,即使用python在多个文本文档上应用类似的正则表达式模式并找到日期。我有多个文档,日期格式不同。例如2018年4月,2018年4月13日,2018年12月12日,2018年12月10日,2018年1月14日等。对于每个文档,我都有不同的模式。但是我必须从多个文档中得出通用模式。请帮忙。

代码:

import re
data = open("/home/system/Documents/Heena/RE/DateFormats.txt",'r')
str1 = ''.join(str(e) for e in data)

re.findall("[\d]{1,2}/[\d]{1,2}/[\d]{2,4}",str1)
#['12/12/1995', '95/12/12']

re.findall("[\d]{1,2}-[\d]{1,2}-[\d]{2,4}",str1)
#['12-12-1995', '95-12-12']

re.findall("[\d]{1,2} [ADFJMNOS]\w* [\d]{2,4}",str1)
#['12 DEC 1995']

我为每个日期应用了不同的正则表达式模式。我已经在“#”标签中显示了此模式的输出。如果有人可以帮助我,那对我非常有益。

0 个答案:

没有答案