对于诸如“更换碳酸化器浮子开关和泄压阀”的句子。
我想提取以下内容: {更换碳酸化器浮子开关},{更换减压阀}
在使用Spacy作为语言模型时,该句子的依存关系树是:
所以我知道碳化器是Replaced(动词)的直接宾语(djob),但是: 1.碳酸化器本身不是,而是三重NOUN“碳酸化器浮子开关”的一部分,并且还更换了“泄压阀”,它们也应作为替换对象。
有什么想法吗?
答案 0 :(得分:2)
问题似乎不在于从树中提取化合物,而在于解析本身:这是不正确的。 Spacy依赖解析器可能还没有受过“碳酸化器浮子开关”和“泄压阀”等技术术语的培训,也不知道它们如何组合在一起。
也许您需要寻找其他依赖解析器(例如Stanford CoreNLP-它可以进行正确的解析,如图所示)。或者,如果您确实确实需要Spacy,则可能需要收集并标记您自己的训练数据,然后在上面调整Spacy解析器。