我有大量的文本(18,000个段落),我需要从中提取所有日期。 不幸的是,日期以多种形式出现,我不希望通过基于手动规则的正则表达式解决方案丢失任何形式,该解决方案可以捕获大多数但不是所有日期。
我首先获取每个段落的所有子字符串,然后尝试使用Date.parse
和moment
对它们进行日期解析,但是我不太兴奋。
以下是我无法自动解析的日期示例:7th of april 2005
Date.parse("7th of april 2005")
的NaN
是否有自动方法来确定字符串是否为日期?
答案 0 :(得分:3)
如评论所示,您有两种选择:
如果您的日期位于不同的时区,这将无济于事。如果您的某些条目中的时区不明确,则需要手动对其进行说明。