将标签ID分配给span时出错:不在StringStore中

时间:2018-07-03 10:47:28

标签: python-3.x spacy

由于我是spacy和python的新手,因此在这里我试图创建一个用户定义的标签来识别短语匹配,而在解析时我无法将哈希值分配给“标签”,遇到“错误,将标签ID XXXX分配给跨度对象”

sudo apt-get install libicu-dev

3 个答案:

答案 0 :(得分:1)

尝试将标签添加到nlp词汇表中。

from spacy.strings import StringStore

animal_hash = StringStore([u'ANIMAL']) # <-- match id
nlp.vocab.strings.add('ANIMAL')

答案 1 :(得分:0)

使用nlp.add_pipe(entity_matcher) 时出现分段错误。我这样删除了参数,

[('Barack Obama', 'PERSON'), ('tree kangaroo', 'ANIMAL')]

您的代码没有其他变化,输出为

extension CATransition {
    func fadeTransition() -> CATransition {
        let transition = CATransition()
        transition.duration = 0.4
        transition.type = CATransitionType.fade
        transition.subtype = CATransitionSubtype.fromRight

        return transition
    }
}

我无法重现您的错误。 Spacy版本为“ 2.0.2”

答案 2 :(得分:0)

当我将小型模型en_core_web_sm与Spacy'2.0.16'一起使用时,我注意到了相同的错误。但是,仅切换到更大的模型en_core_web_md即可为我解决。