解析日期的文本字符串 - 而不是标准的转换问题!

时间:2010-01-21 12:07:39

标签: python parsing

有没有人知道一个库 - 理想情况下是Python,可以从文本中提取日期?

“我们今天去图书馆” - > 1月21日10日 “从1月1日开始” - > 1月1日10日 “2009年2月3日至5日期间的任何时间” - > 2009年2月3日,2月5日

这是一个棘手的问题,可能就是为什么我找不到任何东西! 如果有帮助的话,已经使用了NLTK。

3 个答案:

答案 0 :(得分:4)

看起来这个模块正是您所需要的:parsedatetime

答案 1 :(得分:2)

PyParsing网站为parsing time expressions添加了一些奖励脚本。我想说值得一看!

编辑:当我输入我的建议时,我看到你已经到了那里。祝你好运!

答案 2 :(得分:1)

感谢您的贡献 - 最后我跟进了其中一条评论,导致了pyparsing,这导致了解决方案的开始。非常感谢所有人。

已经发布了正在进行的工作,这里有两个pyparsing代码段http://pbjots.blogspot.com/2010/01/using-pyparsing-to-extract-dates-from.html,以防他们帮助任何人。