应用错误收集

考虑以下句子：

沙子已经开始滴入水底了。

树：（根（S       （NP（NNP金沙））       （副总裁（VBD有）         （ADVP（已经有RB））         （副总裁（VBN开始）           （S             （副总裁）               （副总裁（VB le流）                 （PP（IN成）                   （NP（DT the）（NN底部）））））））））       （。。）））

依赖性解析器：[nsubj（begun-4，Sands-1），nsubj：xsubj（trickle-6，   Sands-1），aux（begun-4，had-2），advmod（begun-4，已经3），   root（ROOT-0，Beginning-4），mark（trickle-6，to-5），xcomp（begun-4，   细流6），案例（底部9，底部7），深度（底部9，底部8），   nmod：into（trickle-6，bottom-9），punct（begun-4，.-10）]

依赖解析器失败有两个原因。

1）“ Sands”一词是专有名词复数（NNPS），但POS标记器输出给出的NNP为专有名词，因此标记器中出现错误，该错误继而传播到依赖项解析器POS以生成依赖性”。要处理这种情况，您可以使用其失败的句子来训练POS标记器。

2）句子的上下文对于依赖解析器来说可能是全新的，因为大多数解析器（如spacy，stanford，nltk等）都是经过训练的ML模型，因此，为了处理这种情况，您可以使用new分别训练依赖解析器句子。

您可以参考此链接以了解如何训练POS标记器和依赖项解析器： https://spacy.io/usage/training#section-tagger-parser

希望它能回答您的问题。

依赖解析器失败的示例

1 个答案: