我想使用Spacy的命名实体可视化工具来可视化一个句子。我有一句话,在令牌上有一些用户定义的标签,我想使用NER渲染API可视化它们。
我不想训练和生成预测模型,我需要所有来自外部来源的标签,只需要可视化而不会与前端库混淆太多。
有什么想法吗?
谢谢
答案 0 :(得分:0)
您可以手动修改实体列表(doc.ents
),并使用标记偏移量添加新的跨度。请注意,实体完全不能重叠。
import spacy
from spacy.tokens import Span
nlp = spacy.load('en', disable=['ner'])
doc = nlp("I see an XYZ.")
doc.ents = list(doc.ents) + [Span(doc, 3, 4, "NEWENTITYTYPE")]
print(doc.ents[0], doc.ents[0].label_)
输出:
XYZ NEWENTITYTYPE