machine-learning - 使用句子上下文的命名实体识别

命名实体识别仅定义为标记句子的连续段并为它们分配预定义集中的标签。机器学习的识别器（例如spacy使用的识别器）确实使用了整个句子的上下文，但是，一旦训练了模型，就无法添加新标签，例如“生日”。如果您有注释这些实体的大型语料库，则可以重新训练spacy模型，以便它能够使用您的标签。

也许过于繁琐的机器会使用某些knowledge extraction方法，这些方法基本上会连接已识别的实体并为其分配一些语义标签。在您的情况下，它类似于：[PERSON] (was born on) [DATE]。

无论如何，如果您要解决的任务与在特定上下文中重新标记实体一样容易，那么我将针对特定情况编写一组规则。诸如此类：如果实体是日期，并且句子中有“出生”或“出生”，则它是您的出生日期实体。或者，您也可以基于从spacy获得的依赖关系解析来制定一些更高级的规则。