OpenNLp组织培训数据

时间:2013-06-11 11:03:06

标签: opennlp

我从命令行训练我的opennlp组织实体查找器数据,但它显示空指针异常

我用过:

  

opennlp TokenNameFinderTrainer -model en-ner-person.bin -lang en -data> en-ner-> person.train -encoding UTF-8

1 个答案:

答案 0 :(得分:0)

我认为您的问题是您使用“人员”类型的培训数据。

首先,您应该为“组织”类型创建培训数据:

$ bin/opennlp TokenNameFinderConverter conll03 -data eng.train -lang en -types org > corpus_train_org.txt

然后培训你的模特:

$ bin/opennlp TokenNameFinderTrainer -lang en -encoding utf8 -iterations 500 -data corpus_train_org.txt -model en_ner_organization.bin