OpenNLP无法识别“2009年1月10日”格式的日期吗?

时间:2011-01-18 10:14:21

标签: java date text-mining opennlp

OpenNLP(Java中)无法识别格式为“2010年1月10日”或“2010年1月10日”的日期。在使用OpenNLP tokenizer之前,我用文本中的空字符串“”替换了文本中的所有','并且它适用于“2010年1月10日”形式的日期。所以,我试图用“,”替换“th”,但它没有用。我们如何确保使用OpenNLP识别上述表格的日期?

提前致谢

1 个答案:

答案 0 :(得分:0)

有关日期查找和格式的说明,此newer post效果很好。它讨论了识别周围标记的日期的模型,因为它是一个统计模型。

对于上面的情况,正如评论所说,如果你想要替换th和the,那么你必须应用两个替换,或者更好的是用空字符串替换th。