迭代列表时,dateutil.parser出错

时间:2018-03-15 13:11:11

标签: text-mining date-parsing

  • 将大型文本文件转换为字符串列表(每行=列表中的一个元素)['...','...','...']
  • sample_data = ['2017-May-15 13:56:49.578 Event Dispense Sc 06mm Beschichtungsbreite ist:5.99 mm','2017-May-15 14:12:11.062 Event Runtime SC 09mm neuer Druck:27.560PSI']
  • 尝试从每个列表元素中提取日期(每行包含一个标准格式的日期)

我的代码:

dparser.parse(sample_data[0],fuzzy=True))

返回所需的日期。

但是,在尝试通过列表进行迭代时如下所示

for elements in sample_data:  
    dparser.parse(elements,fuzzy=True)

我收到一条错误消息:ValueError: Unknown string format

2 个答案:

答案 0 :(得分:0)

虽然我无法从文档http://dateutil.readthedocs.io/en/stable/parser.html中看到实际数据。这意味着tzinfo不是有效的字符串格式

示例:如果日期是2018年3月15日而不是2018年3月15日。它会引发一个ValueError,尝试检查列表以了解是否属于这种情况。

答案 1 :(得分:0)

解决了正则表达式函数和一些争论。

仍然无法说明为什么使用dparser.parse的迭代不起作用。