将各种不一致的日期字符串翻译成有效的“日期”;蟒蛇

时间:2011-05-25 14:18:55

标签: python date

我有各种文本输入文件,包含需要处理的基于行的记录(csv / tsv等);每个文件中的每一行通常都有一个日期字段,日期格式也有很大差异。

我的第一直觉是(手动)尝试识别每种日期格式,然后为每一行使用正则表达式来识别格式,验证数据并转换为有效的日期对象。

但是,我想借此机会提升我对python和编程的一般知识,并希望你能提供一些技巧,我可以用它来更有效地管理这项工作,在这个过程中学习一些东西。

谢谢!

2 个答案:

答案 0 :(得分:1)

使用python-dateutil模块,它的parse方法可以检测并解析许多不同的日期格式。

请注意,python-dateutil在如何处理模糊日期(年,月或日优先)方面非常具体,让您调整解析这些日期的方式。这当然取决于您的数据是什么样的;您可能需要测试一些样品并进行手工验证。

答案 1 :(得分:0)

我不确定这是否可行。请考虑以下日期:

83-05-03 10:20

这是:

  • 1983年5月3日上午10:20?
  • 2083年3月5日,晚上10:20?

如果没有指定格式,我看不出如何解决这些歧义。