依赖解析器失败的示例

时间:2018-11-30 21:54:07

标签: nlp dependency-parsing natural-language-processing

有人能给我几句有关依赖解析器何时失败,为什么失败以及如何解决的句子吗?

1 个答案:

答案 0 :(得分:2)

考虑以下句子:

  

沙子已经开始滴入水底了。

     

树:(根(S       (NP(NNP金沙))       (副总裁(VBD有)         (ADVP(已经有RB))         (副总裁(VBN开始)           (S             (副总裁)               (副总裁(VB le流)                 (PP(IN成)                   (NP(DT the)(NN底部)))))))))       (。。)))

     

依赖性解析器:[nsubj(begun-4,Sands-1),nsubj:xsubj(trickle-6,   Sands-1),aux(begun-4,had-2),advmod(begun-4,已经3),   root(ROOT-0,Beginning-4),mark(trickle-6,to-5),xcomp(begun-4,   细流6),案例(底部9,底部7),深度(底部9,底部8),   nmod:into(trickle-6,bottom-9),punct(begun-4,.-10)]

依赖解析器失败有两个原因。

1)“ Sands”一词是专有名词复数(NNPS),但POS标记器输出给出的NNP为专有名词,因此标记器中出现错误,该错误继而传播到依赖项解析器POS以生成依赖性”。 要处理这种情况,您可以使用其失败的句子来训练POS标记器。

2)句子的上下文对于依赖解析器来说可能是全新的,因为大多数解析器(如spacy,stanford,nltk等)都是经过训练的ML模型,因此,为了处理这种情况,您可以使用new分别训练依赖解析器句子。

您可以参考此链接以了解如何训练POS标记器和依赖项解析器: https://spacy.io/usage/training#section-tagger-parser

希望它能回答您的问题。