所以我在这里做一个项目我需要处理文本的信息。我使用了opennlp并尝试了freeling,两者都得到了很好的结果(lemmas,除以句子,除以短语和POS)。但后来我用这个CONLL(http://www.linguateca.pt/floresta/CoNLL-X/)文件训练了maltparser,而malparser使用的POS标签与opennlp和freeling不同。我知道这样做的一种方法是将POS标签表单opennlp(或freeling)转换为malparser接受。我想知道的是,是否有任何程序使用CONLL格式来训练他的算法,因此我得到的POS和引理是由malparser知道的。如果可能的话,可以使用适用于Java和Windows的程序。
泰