从文本中提取关系

时间:2017-04-09 08:19:16

标签: stanford-nlp

这是一个示例文本:

  

去年,TAUS的创始人兼董事Jaap van der Meer撰写了一篇题为“未来不需要译者”的挑衅性博客文章,认为MT的质量将不断提高,而且对于许多应用来说,翻译不够完美会很好的。

现在我想了解:

PERSON(Jaap van der Meer) is JOB(founder and director) of ORGANISATION (TAUS)

我从Standford OpenIE和OpenIE得到的是:

TAUS    has     founder
Jaap van der Meer       wrote   blogpost

总的来说,我想从新闻文章等自由文本中提取组织和组织,人员和组织之间的工作岗位/业务关系。

如何使用Stanford OpenIE? 有没有更好的工具呢?

1 个答案:

答案 0 :(得分:3)

您应该尝试使用KBPAnnotator。这将提取(人,职称,职称)关系和(人,组织,工作_for)关系等。

示例命令:

java -Xmx8g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,regexner,parse,mention,entitymentions,coref,kbp -file example.txt -outputFormat text