从.txt文件中提取日期

时间:2018-11-19 19:44:21

标签: python regex python-3.7

我有一个.txt文件。它包含一些日期。我要查找的单词前面带有单词:“ Date:dd.MM.yy Hour:HH:mm”。我尝试通过

进行匹配
 matches=re.findall(r'Date:\s\d\d.\d\d.\d{4}\sHour:\s\d\d:\d\d', text)

但是我只需要提取特定格式的数字-“ dd.MM.yy HH:mm”。该文件还包含其他一些日期-我看不到其他匹配方式。现在我很明显会收到“日期:28.10.2018小时:11:00”。

1)是否有更好的方法来搜索.txt文件?

2)如何从字符串中提取日期和小时,并省略单词?

1 个答案:

答案 0 :(得分:0)

您应该使用capture groups来获取您感兴趣的信息:

import re
s = "Date: 11.19.2018 Hour: 15:23"
matches = re.findall(r'Date: (\d{2}\.\d{2}\.\d{4}) Hour: (\d{2}:\d{2})', s)

变量matches将包含:

[('11.19.2018', '15:23')]