我一直在使用Stanford POS Tagger来标记句子中的词性。我从文档和有关stackoverflow主题的其他问题中学到的是,下面的代码给出了句子的POS标记
MaxentTagger tagger = new MaxentTagger("./left3words-wsj-0-18.tagger");
String tags=tagger.tagString(Summary);
但我想要的是获得单个单词的POS标签。一种可能的方法是打破输入字符串并逐字输入Tagger,但它似乎不优雅,我认为它增加了错误的可能性。 Javadoc表示apply函数可用于返回TaggedWords的ArrayList,但我无法成功调用此函数。 任何想法如何使用斯坦福POS获得字符串的单个单词的POS标记 Tagger要么通过应用函数还是其他一些函数??
答案 0 :(得分:2)
看起来你应该使用tokenizeText()和tagSentence()来获取标记词的列表。查看postagger发行版中包含的TaggerDemo.java。