我正在使用OpenNLP模型进行名称实体识别,但问题是它只能识别美国和英国的名字(外国名字),所以我需要识别印度名字。
怎么可能?
答案 0 :(得分:0)
NER解决方案往往是特定于域的,使用硬编码的单词列表作为命名实体的信号(特征)和/或内部字母结构。
英国/美国的名字彼此相似,也与其他欧洲名字相似,因为许多流行的美国名字和姓氏来自非英国的欧洲移民。印度名称有显着差异,常用的名称/姓氏列表和训练数据语料库通常不包含太多或任何印度特定的数据。
要解决您的问题,您需要根据适合您特定领域的数据训练专门的NER模型。