如何在OpenNLP中通过NER识别印度名字?

时间:2016-03-16 05:47:54

标签: java opennlp named-entity-recognition

我正在使用OpenNLP模型进行名称实体识别,但问题是它只能识别美国和英国的名字(外国名字),所以我需要识别印度名字。

怎么可能?

1 个答案:

答案 0 :(得分:0)

NER解决方案往往是特定于域的,使用硬编码的单词列表作为命名实体的信号(特征)和/或内部字母结构。

英国/美国的名字彼此相似,也与其他欧洲名字相似,因为许多流行的美国名字和姓氏来自非英国的欧洲移民。印度名称有显着差异,常用的名称/姓氏列表和训练数据语料库通常不包含太多或任何印度特定的数据。

要解决您的问题,您需要根据适合您特定领域的数据训练专门的NER模型。