选择要标记的特定实体

时间:2019-06-13 20:20:17

标签: spacy

是否只有NER标签可以标记实体上的子集。例如,我可能只需要日期和货币实体,我该如何完成?

我浏览了EntityRecognized文档,但未发现删除实体的任何内容。

1 个答案:

答案 0 :(得分:0)

通过重新训练NER标签器,似乎可以实现此目的。 (如果您对此路线感兴趣,请查看讨论问题的this article。)

但是您绝对确定有必要吗?

例如,您可以创建一个过滤结果的方法,以便它仅返回您要查找的实体类型。

def get_entities(doc):
    for entity in doc.ents:
        if entity.label_ in ["DATE","MONEY"]:
            yield entity
        else:
            continue

然后,您无需遍历doc.ents,而可以遍历get_entities(doc)

这对我来说似乎是更简单的方法。