如何对提取的关系(NLP)进行分类?

时间:2016-04-19 15:43:35

标签: machine-learning nlp classification stanford-nlp text-mining

有一些没有标记的语料库。我从它中提取三元组(OBJECT,RELATION,OBJECT)。对于关系提取,我使用Stanford OpenIE。但我只需要一些三元组。例如,我需要关系“ 资助 ”。

文本 (Datadog, announced, $94.5 million Round)

从这篇文章中我想提取关系#define SIZ 1024 #include <stdio.h> extern void do_something_with_the_array(float *a[], int *n); int main(int argc, const char * argv[]) { float f[SIZ]; int k = 0; while ((scanf("%f", &f[k]) == 1)&&(k < SIZ)) { k++; } do_something_with_the_array(f, k); return 0; }

我只有一个想法:

  1. 使用StanfordCoreference检测第一句中的'Datadog',第二句中的'it'是同一实体
  2. 尝试聚类关系,但我认为它不会很好用
  3. 可能有更好的方法吗?可能是我需要标记语料库(我还没有)?

0 个答案:

没有答案