标签: java apache part-of-speech
我正在使用Apache OpenNLP词性标注器在文本集合中进行单词类识别。 我正在尝试评估标记器的性能,我想知道它可能已经训练了哪些数据? 英语中存在的模型名称不会提示所使用的训练数据。
Apache OpenNLP文档提到了几个可能也用于训练POS-Tagger的语料库。 http://opennlp.apache.org/documentation/manual/opennlp.html#tools.corpora
有谁知道如何找出英国POS模型培训的培训数据?