我有一个.txt文件。它包含一些日期。我要查找的单词前面带有单词:“ Date:dd.MM.yy Hour:HH:mm”。我尝试通过
进行匹配 matches=re.findall(r'Date:\s\d\d.\d\d.\d{4}\sHour:\s\d\d:\d\d', text)
但是我只需要提取特定格式的数字-“ dd.MM.yy HH:mm”。该文件还包含其他一些日期-我看不到其他匹配方式。现在我很明显会收到“日期:28.10.2018小时:11:00”。
1)是否有更好的方法来搜索.txt文件?
2)如何从字符串中提取日期和小时,并省略单词?
答案 0 :(得分:0)
您应该使用capture groups来获取您感兴趣的信息:
import re
s = "Date: 11.19.2018 Hour: 15:23"
matches = re.findall(r'Date: (\d{2}\.\d{2}\.\d{4}) Hour: (\d{2}:\d{2})', s)
变量matches
将包含:
[('11.19.2018', '15:23')]