我想评估依赖解析器,考虑标点符号而不考虑标点符号。如果我不想考虑标点符号,我该如何定义输入数据?我应该使用相同的输入数据(带标点符号的普通句子)作为输入,解析器定义所有包含标点符号的依赖项。在评估期间,我排除了与句点和逗号等相关的所有依赖项。或者我应该删除输入句子中的标点符号? 为什么在评估依赖解析器时通常不包括标点符号(CONLL-X)?
答案 0 :(得分:3)
无论评估细节如何,输入数据都应定义相同。
在标准CoNLL评估中,我们根本不计算通向标点符号的弧。 ("标点符号"在标准eval中为`` '' . , :
。(CoreNLP reference))
关于"为什么,"我没有一个非常令人满意的答案..这里有一些猜测:
amod
依赖关系进行比较,鉴于我们同意注释方案,这种依赖关系确实无法解决。)`*我不是依赖语法的专家,所以请不要太认真地对待我:)