我在使用Python 3.5.2和spaCy 2.0的Ubuntu机器上。我正在训练一个空白的西班牙模型来识别简历中的实体。为此,我使用自定义单词嵌入,我正在做一个大型实体注释项目。我能够使用单词嵌入来分割简历并找出该段所属的简历的哪一部分,并且我想使用该知识来增强spaCy的NER(例如,如果一个实体属于工作体验部分,则更有可能是一个组织而不是教育机构)。我正在查看文档,虽然我看到有一种方法可以添加自定义属性和/或使用管道和扩展来计算它们我无法判断NER算法是否会默认使用它们作为功能,或者我是否需要添加自定义代码。
有没有办法手动执行此操作或自定义行为?
谢谢,并问候。