有人能给我几句有关依赖解析器何时失败,为什么失败以及如何解决的句子吗?
答案 0 :(得分:2)
考虑以下句子:
沙子已经开始滴入水底了。
树:(根(S (NP(NNP金沙)) (副总裁(VBD有) (ADVP(已经有RB)) (副总裁(VBN开始) (S (副总裁) (副总裁(VB le流) (PP(IN成) (NP(DT the)(NN底部))))))))) (。。)))
依赖性解析器:[nsubj(begun-4,Sands-1),nsubj:xsubj(trickle-6, Sands-1),aux(begun-4,had-2),advmod(begun-4,已经3), root(ROOT-0,Beginning-4),mark(trickle-6,to-5),xcomp(begun-4, 细流6),案例(底部9,底部7),深度(底部9,底部8), nmod:into(trickle-6,bottom-9),punct(begun-4,.-10)]
依赖解析器失败有两个原因。
1)“ Sands”一词是专有名词复数(NNPS),但POS标记器输出给出的NNP为专有名词,因此标记器中出现错误,该错误继而传播到依赖项解析器POS以生成依赖性”。 要处理这种情况,您可以使用其失败的句子来训练POS标记器。
2)句子的上下文对于依赖解析器来说可能是全新的,因为大多数解析器(如spacy,stanford,nltk等)都是经过训练的ML模型,因此,为了处理这种情况,您可以使用new分别训练依赖解析器句子。
您可以参考此链接以了解如何训练POS标记器和依赖项解析器: https://spacy.io/usage/training#section-tagger-parser
希望它能回答您的问题。