Python dateutil ValueError:未知的字符串格式

时间:2015-11-08 23:07:19

标签: python string text-files

我想从文本文件中提取日期。日期写成如下:word-January 05,2015-word。

from dateutil import parser

content = ""

data = open("some_doc.txt", "r")
for line in data:
    content = content + line
content = str(content) # I don´t think that this is necessary but just to be sure

d = parser.parse("content", fuzzy = True)

这段代码总是给我以下错误:

Traceback (most recent call last):
  File "C:/", line 16, in <module>
    parser.parse(content, fuzzy = True)
  File "C:\", line 698, in parse
    return DEFAULTPARSER.parse(timestr, **kwargs)
  File "C:\", line 304, in parse
    raise ValueError("unknown string format")
ValueError: unknown string format

有人知道我应该更改什么,或者有其他解决方案来提取这种格式的日期吗?

2 个答案:

答案 0 :(得分:0)

您可以使用regexp解析内容,然后使用dateutils的解析。

分享文件内容以便更好地为您提供帮助。

PD:对不起我的英文。

问候。

答案 1 :(得分:0)

我认为您可以在for循环中对'line'进行解析,而不是之后的'content',因为如果有多个日期,则parse()不起作用。

这将解析文件的每一行并从行中获取日期(假设您在文件中有> 1个日期)。