创建我们自己的模型来训练openNLP并在java中使用它

时间:2014-11-26 10:04:07

标签: java opennlp training-data

我是openNLP的新手。我想知道如何构建我们自己的模型来训练以使用openNLP在java中选择我们的特定数据。非常感谢你的所有答案。

1 个答案:

答案 0 :(得分:1)

OpenNLP中有几个可训练的组件。 DocumentCategorizer 的NameFinder 标记生成器 POSTagger 分块 解析器

我最常使用的是NameFinder(用于命名实体提取/识别)和documentCategorizer,用于文本分类,如情感分析。

该名称取消器具有此帖可能有助于理解的培训格式 traning OPenNLP error 还有这个 Writing our own models in openNLP

documentCategorizer格式不同但非常简单。看看OpenNLP网站上的文档 http://opennlp.apache.org/documentation/1.5.3/manual/opennlp.htm

HTH

刚看到你评论,所以更新。您想为您的用例训练一个名称取名器。因此,您创建一个句子文件,并在每个句子中注释句子中的实体,如我提供的链接,然后构建模型。你需要大约15000个句子来获得非常好的结果。