默认情况下,Apache OpenNLP在运行其命名实体识别(NER)模型时会使用哪些功能?

时间:2018-10-17 14:30:19

标签: opennlp named-entity-recognition ner maxent

我知道Apache OpenNLP的NER标记器使用MaxEnt模型。但是,Apache OpenNLP在运行其命名实体识别(NER)模型时会默认使用哪些功能?以及我们如何在OpenNLP(Java实现)中合并/自定义新功能?

1 个答案:

答案 0 :(得分:1)

在Apache OpenNLP NER中,它允许用户通过XML文件定义功能。默认的XML是这样的:

https://github.com/apache/opennlp/blob/master/opennlp-tools/src/main/resources/opennlp/tools/namefind/ner-default-features.xml

如果要自定义它,请在训练模型时使用-featuregen选项:

$ opennlp TokenNameFinderTrainer -featuregen your-features-definition.xml -model my-model.bin ...

在执行TokenNameFinder时,您无需指定自定义功能XML文件,因为模型文件包含您的功能信息。