Spacy更新NER

时间:2018-10-26 13:35:54

标签: nlp spacy ner

Spacy documentation显示了如何使用其他培训示例来更新NER。但是,它使用实体偏移量进行训练。如何使用 BILUO方案执行相同的任务?我想使用的培训示例包含每个句子的标记列表以及相应的 BILUO标签

1 个答案:

答案 0 :(得分:0)

感谢您的提问。 来自documentation

  

spacy.gold模块还公开了两个辅助函数,用于将偏移量转换为BILUO标签,并将BILUO标签转换为实体偏移。

所以,它会变成这样:

from spacy.gold import offsets_from_biluo_tags
doc = nlp('I like London.')
tags = ['O', 'O', 'U-LOC', 'O']
entities = offsets_from_biluo_tags(doc, tags)

使用每个句子的entities变量创建TRAIN_DATA列表,并继续进行文档中的代码。

希望它会有所帮助:)