应用错误收集

有一些没有标记的语料库。我从它中提取三元组（OBJECT，RELATION，OBJECT）。对于关系提取，我使用Stanford OpenIE。但我只需要一些三元组。例如，我需要关系“ 资助 ”。

文本： (Datadog, announced, $94.5 million Round)

从这篇文章中我想提取关系#define SIZ 1024 #include <stdio.h> extern void do_something_with_the_array(float *a[], int *n); int main(int argc, const char * argv[]) { float f[SIZ]; int k = 0; while ((scanf("%f", &f[k]) == 1)&&(k < SIZ)) { k++; } do_something_with_the_array(f, k); return 0; }

我只有一个想法：

使用StanfordCoreference检测第一句中的'Datadog'，第二句中的'it'是同一实体
尝试聚类关系，但我认为它不会很好用

如何对提取的关系（NLP）进行分类？

0 个答案: