Apache OpenNLP,如何培养或制作新模型?

时间:2014-09-08 10:32:57

标签: java nlp opennlp

例如en name finder找不到某些名称,我想向现有数据模型添加新数据。 我找到了这个click here答案,但我不明白

什么是en-ner-person.train?它是en-ner-person.bin的克隆吗?

我们应该加载现有模型并从文件中添加新数据?哪种类型的信息应包含txt file

2 个答案:

答案 0 :(得分:2)

en-ner-person.train是培训文件,en-ner-person.bin是模型。

培训文件包含培训模型的培训数据。

文本文件应包含您要以适当格式添加的训练数据。看看this,它解释了如何训练模型。

答案 1 :(得分:0)

您可以查看此answer,他使用维基百科拥有一套语料库(一组文档)来训练您的模型。