创建远距离监督培训数据时,如果存在多个关系,如何确定两个实体之间的关系?

时间:2019-12-02 02:15:02

标签: nlp information-extraction

我有了远距离监督的概念。据我了解,创建训练数据的过程就像;

  • 从句子中提取命名实体
  • 从每个句子中找到两个分别名为“ e1”和“ e2”的实体。
  • 在知识库(freebase等)中搜索这两个实体,以找到它们之间的关系

在这一步我很困惑。如果这两个实体(e1和e2)之间的关系超过1,该怎么办?如果是这样,我应该选择哪个关系?

1 个答案:

答案 0 :(得分:1)

这取决于您正在训练的模型。

您是否正在学习一种关系的模型并进行引导?然后仅注意该一种关系,并将其他关系从数据库中删除。

您是否要学习一堆人际关系?然后,使用每个模型的存在或不存在作为模型中的特征。 Universals Schemas就是这样工作的。

这是来自Universal Schema论文的特征矩阵的图像:

Feature matrix from Universal Schemas