我想从文本文件中提取日期。日期写成如下:word-January 05,2015-word。
from dateutil import parser
content = ""
data = open("some_doc.txt", "r")
for line in data:
content = content + line
content = str(content) # I don´t think that this is necessary but just to be sure
d = parser.parse("content", fuzzy = True)
这段代码总是给我以下错误:
Traceback (most recent call last):
File "C:/", line 16, in <module>
parser.parse(content, fuzzy = True)
File "C:\", line 698, in parse
return DEFAULTPARSER.parse(timestr, **kwargs)
File "C:\", line 304, in parse
raise ValueError("unknown string format")
ValueError: unknown string format
有人知道我应该更改什么,或者有其他解决方案来提取这种格式的日期吗?
答案 0 :(得分:0)
您可以使用regexp解析内容,然后使用dateutils的解析。
分享文件内容以便更好地为您提供帮助。
PD:对不起我的英文。问候。
答案 1 :(得分:0)
我认为您可以在for循环中对'line'进行解析,而不是之后的'content',因为如果有多个日期,则parse()不起作用。
这将解析文件的每一行并从行中获取日期(假设您在文件中有> 1个日期)。