如果我使用带有english_SD模型的Stanford CoreNLP神经网络依赖解析器,该模型根据网站(link, bottom of the page)表现相当不错,与demo相比,它提供了完全不同的结果。假设基于LexicalizedParser(或至少任何其他)。
如果我在演示页面中输入我不喜欢汽车这句话,结果就是:
如果我将相同的句子放入神经网络解析器中,则会产生以下结果:
在神经网络解析器的结果中,一切都取决于喜欢。我认为这可能是由于不同的POS-Tags,但我使用了CoreNLP Maxent Tagger和english-bidirectional-distsim.tagger模型,所以我觉得很常见。关于这个的任何想法?
答案 0 :(得分:2)
默认情况下,我们使用english-left3words-distsim.tagger
模型作为标记器,它比双向模型更快但偶尔会产生更差的结果。同时,在演示页面上使用的选区解析器和您使用的神经网络依赖解析器严重依赖于POS标签,不同的POS序列导致不同的解析并不奇怪,特别是当主要动词有函数单词标记(IN
= prepositon)而不是内容单词标记(VB
=动词,基本形式)。
但是请注意,演示输出依赖关系在新的Universal Dependencies表示中解析,而english_SD
模型将句子解析为旧的斯坦福依赖关系表示。对于你的例句,正确的解析实际上是相同的,但你会看到其他句子的差异,特别是如果它们具有在新表示中被区别对待的介词短语。