应用错误收集

核心nlp演示和解析器演示之间的POS标记结果不一致

时间：2018-02-23 01:26:07

标签： stanford-nlp

之间的POS标记结果不一致

P：http://nlp.stanford.edu:8080/parser/

和

C：http://nlp.stanford.edu:8080/corenlp/process

如，

C：我们去了东/ JJ到奥斯陆。 P：我们去了东/ RB到奥斯陆。

C：我们都是/ DT变老了。 P：我们都是/ RB变老了。

C：你对假期感到兴奋/ VBN吗？警：你对你的假期感到兴奋/ JJ？

C：你做过/ VBP吗？ P：你做过VB吗？

似乎解析器的性能优于核心nlp，但我无法通过在核心nlp zip文件中提供的模型之间切换来复制解析器结果。

有什么想法吗？

1 个答案:

答案 0 :(得分：0)

如果您使用这些不同的管道，您将获得不同的词性标记结果：

tokenize,ssplit,pos,lemma,parse

VS

tokenize,ssplit,parse

后者将执行部分语音标记作为解析过程的一部分。前者使用专用于词性标注的MEMM序列标记模型。