如何使用python从文本文件中提取不同格式的所有日期? 有关信息,该文本是用法语写的。
例如:
[04/30/2009 blablo 06/20/98其他8/2/69发生在这一刻2011年1月25日也许这一个9/3/2002其他blablabla Janvier 2005年今年1974年]
PS: 我无法知道所有日期格式,因为我寻求的功能必须适用于许多文本
答案 0 :(得分:1)
实际上这是python library,虽然是英文。
string_with_dates = """
...
entries are due by January 4th, 2017 at 8:00pm
...
created 01/15/2005 by ACME Inc. and associates.
...
"""
import datefinder
matches = datefinder.find_dates(string_with_dates)
for match in matches:
print match
2017-01-04 20:00:00
2005-01-15 00:00:00
要将此翻译为法语,我建议您查看top of this file,文件顶部有一个很大的内容。一堆英国正则表达式,这可以翻译成法语。