Question

Spacy documentation显示了如何使用其他培训示例来更新NER。但是，它使用实体偏移量进行训练。如何使用 BILUO方案执行相同的任务？我想使用的培训示例包含每个句子的标记列表以及相应的 BILUO标签。

Answer 1

感谢您的提问。来自documentation：

spacy.gold模块还公开了两个辅助函数，用于将偏移量转换为BILUO标签，并将BILUO标签转换为实体偏移。

所以，它会变成这样：

from spacy.gold import offsets_from_biluo_tags
doc = nlp('I like London.')
tags = ['O', 'O', 'U-LOC', 'O']
entities = offsets_from_biluo_tags(doc, tags)

使用每个句子的entities变量创建TRAIN_DATA列表，并继续进行文档中的代码。

希望它会有所帮助：）

Spacy更新NER

1 个答案: