OpenNLP(Java中)无法识别格式为“2010年1月10日”或“2010年1月10日”的日期。在使用OpenNLP tokenizer之前,我用文本中的空字符串“”替换了文本中的所有','并且它适用于“2010年1月10日”形式的日期。所以,我试图用“,”替换“th”,但它没有用。我们如何确保使用OpenNLP识别上述表格的日期?
提前致谢
答案 0 :(得分:0)
有关日期查找和格式的说明,此newer post效果很好。它讨论了识别周围标记的日期的模型,因为它是一个统计模型。
对于上面的情况,正如评论所说,如果你想要替换th和the,那么你必须应用两个替换,或者更好的是用空字符串替换th。