我正在尝试在推文中的文本内完成共识解析。我想尽可能使用为Twitter用例构建的系统,所以我的计划是使用CMU的ark-tweet-nlp包进行标记化和POS标记。然后,我想将其与Stanford NLP中的共参考分辨率系统集成(我的计划是使用CMU的Penn Treebank样式标记器以便于集成)。
我是Stanford NLP的新手,虽然我已经能够实现它的共参考分辨率功能,但我只能弄清楚如何将它用于处理所有它的POS,引理,NER和黑盒子的情况。解析属性界面。我在网上看过如何使用外部POS访问解析器和通过Java接口访问令牌的示例:
String[] sent3 = { "It", "can", "can", "it", "." };
// Parser gets second "can" wrong without help (parsing it as modal MD)
String[] tag3 = { "PRP", "MD", "VB", "PRP", "." };
List<TaggedWord> sentence3 = new ArrayList<TaggedWord>();
for (int i = 0; i < sent3.length; i++) {
sentence3.add(new TaggedWord(sent3[i], tag3[i]));
}
Tree parse = lp.parse(sentence3);
parse.pennPrint();
所以我想知道是否有人知道如何通过类似的共享接口来实现这种情况。