Apache OpenNLP词性标记器:对哪些数据集进行过培训?

时间:2015-05-02 06:39:49

标签: java apache part-of-speech

我正在使用Apache OpenNLP词性标注器在文本集合中进行单词类识别。 我正在尝试评估标记器的性能,我想知道它可能已经训练了哪些数据? 英语中存在的模型名称不会提示所使用的训练数据。

Apache OpenNLP文档提到了几个可能也用于训练POS-Tagger的语料库。 http://opennlp.apache.org/documentation/manual/opennlp.html#tools.corpora

有谁知道如何找出英国POS模型培训的培训数据?

0 个答案:

没有答案