是否只有NER标签可以标记实体上的子集。例如,我可能只需要日期和货币实体,我该如何完成?
我浏览了EntityRecognized文档,但未发现删除实体的任何内容。
答案 0 :(得分:0)
通过重新训练NER标签器,似乎可以实现此目的。 (如果您对此路线感兴趣,请查看讨论问题的this article。)
但是您绝对确定有必要吗?
例如,您可以创建一个过滤结果的方法,以便它仅返回您要查找的实体类型。
def get_entities(doc):
for entity in doc.ents:
if entity.label_ in ["DATE","MONEY"]:
yield entity
else:
continue
然后,您无需遍历doc.ents
,而可以遍历get_entities(doc)
。
这对我来说似乎是更简单的方法。