我知道Apache OpenNLP的NER标记器使用MaxEnt模型。但是,Apache OpenNLP在运行其命名实体识别(NER)模型时会默认使用哪些功能?以及我们如何在OpenNLP(Java实现)中合并/自定义新功能?
答案 0 :(得分:1)
在Apache OpenNLP NER中,它允许用户通过XML文件定义功能。默认的XML是这样的:
如果要自定义它,请在训练模型时使用-featuregen
选项:
$ opennlp TokenNameFinderTrainer -featuregen your-features-definition.xml -model my-model.bin ...
在执行TokenNameFinder时,您无需指定自定义功能XML文件,因为模型文件包含您的功能信息。