使用Spacy

时间:2019-05-13 11:00:10

标签: nlp spacy

对于诸如“更换碳酸化器浮子开关和泄压阀”的句子。

我想提取以下内容: {更换碳酸化器浮子开关},{更换减压阀}

在使用Spacy作为语言模型时,该句子的依存关系树是:

enter image description here

所以我知道碳化器是Replaced(动词)的直接宾语(djob),但是: 1.碳酸化器本身不是,而是三重NOUN“碳酸化器浮子开关”的一部分,并且还更换了“泄压阀”,它们也应作为替换对象。

有什么想法吗?

1 个答案:

答案 0 :(得分:2)

问题似乎不在于从树中提取化合物,而在于解析本身:这是不正确的。 Spacy依赖解析器可能还没有受过“碳酸化器浮子开关”和“泄压阀”等技术术语的培训,也不知道它们如何组合在一起。

也许您需要寻找其他依赖解析器(例如Stanford CoreNLP-它可以进行正确的解析,如图所示)。或者,如果您确实确实需要Spacy,则可能需要收集并标记您自己的训练数据,然后在上面调整Spacy解析器。

enter image description here