使用python从文本中提取不同格式的所有日期

时间:2018-05-16 14:04:25

标签: python regex

如何使用python从文本文件中提取不同格式的所有日期? 有关信息,该文本是用法语写的。

例如:

  

[04/30/2009 blablo 06/20/98其他8/2/69发生在这一刻2011年1月25日也许这一个9/3/2002其他blablabla Janvier 2005年今年1974年]

PS: 我无法知道所有日期格式,因为我寻求的功能必须适用于许多文本

1 个答案:

答案 0 :(得分:1)

实际上这是python library,虽然是英文。

示例(来自github):

string_with_dates = """
...
entries are due by January 4th, 2017 at 8:00pm
...
created 01/15/2005 by ACME Inc. and associates.
...
"""

import datefinder

matches = datefinder.find_dates(string_with_dates)

for match in matches:
    print match

输出:

2017-01-04 20:00:00
2005-01-15 00:00:00

要将此翻译为法语,我建议您查看top of this file,文件顶部有一个很大的内容。一堆英国正则表达式,这可以翻译成法语。