将域知识(自定义功能)添加到NER

时间:2018-01-10 13:53:12

标签: python-3.x machine-learning feature-selection spacy ner

我在使用Python 3.5.2和spaCy 2.0的Ubuntu机器上。我正在训练一个空白的西班牙模型来识别简历中的实体。为此,我使用自定义单词嵌入,我正在做一个大型实体注释项目。我能够使用单词嵌入来分割简历并找出该段所属的简历的哪一部分,并且我想使用该知识来增强spaCy的NER(例如,如果一个实体属于工作体验部分,则更有可能是一个组织而不是教育机构)。我正在查看文档,虽然我看到有一种方法可以添加自定义属性和/或使用管道和扩展来计算它们我无法判断NER算法是否会默认使用它们作为功能,或者我是否需要添加自定义代码。

有没有办法手动执行此操作或自定义行为?

谢谢,并问候。

0 个答案:

没有答案