将Spacy Visualizer与自定义数据一起使用

时间:2019-04-28 14:35:28

标签: data-visualization customization spacy named-entity-recognition

我想使用Spacy的命名实体可视化工具来可视化一个句子。我有一句话,在令牌上有一些用户定义的标签,我想使用NER渲染API可视化它们。

我不想训练和生成预测模型,我需要所有来自外部来源的标签,只需要可视化而不会与前端库混淆太多。

有什么想法吗?
谢谢

1 个答案:

答案 0 :(得分:0)

您可以手动修改实体列表(doc.ents),并使用标记偏移量添加新的跨度。请注意,实体完全不能重叠。

import spacy
from spacy.tokens import Span
nlp = spacy.load('en', disable=['ner'])
doc = nlp("I see an XYZ.")
doc.ents = list(doc.ents) + [Span(doc, 3, 4, "NEWENTITYTYPE")]
print(doc.ents[0], doc.ents[0].label_)

输出:

XYZ NEWENTITYTYPE