在线解析器标记与本地MaxentTagger标记不同

时间:2015-12-22 11:16:49

标签: stanford-nlp

我正在直接运行MaxentTagger:

private void test() {
    MaxentTagger tagger = new MaxentTagger(modelsdir + "wsj-0-18-bidirectional-distsim.tagger");
    String input = "Someone will trip over that cable.";
    System.out.println(tagger.tagString(input));
}

获得以下输出:

  

someone_NN will_NN trip_NN over_IN that_DT cable_NN ._。

但是当使用在线解析器时,我得到了这个输出:

  

您的查询

     
    

有人会绊倒那条电缆。

  
     

标记

     
    

有人/ NN将/ MD跳/ VB over / RP / DT电缆/ NN ./.

  

我尝试使用不同的模型:

MaxentTagger tagger = new MaxentTagger(models + "english-left3words-distsim.tagger");
  

someone_NN will_MD trip_NN over_IN that_DT cable_NN ._。

但我似乎无法获得与在线版相同的结果。

为什么在使用MaxentTagger与在线版本相比时,我会为单词添加不同的标签?

初始化MaxentTagger时我应该使用参数吗?

1 个答案:

答案 0 :(得分:0)

通过"在线解析器"你的意思是CoreNLP演示还是Stanford Parser演示?后者将从句子的分析树中分配词性标签,这可以与词性标签器分配的不同。