Spacy documentation显示了如何使用其他培训示例来更新NER。但是,它使用实体偏移量进行训练。如何使用 BILUO方案执行相同的任务?我想使用的培训示例包含每个句子的标记列表以及相应的 BILUO标签。
答案 0 :(得分:0)
感谢您的提问。 来自documentation:
spacy.gold模块还公开了两个辅助函数,用于将偏移量转换为BILUO标签,并将BILUO标签转换为实体偏移。
所以,它会变成这样:
from spacy.gold import offsets_from_biluo_tags
doc = nlp('I like London.')
tags = ['O', 'O', 'U-LOC', 'O']
entities = offsets_from_biluo_tags(doc, tags)
使用每个句子的entities变量创建TRAIN_DATA列表,并继续进行文档中的代码。
希望它会有所帮助:)