这是一个示例文本:
去年,TAUS的创始人兼董事Jaap van der Meer撰写了一篇题为“未来不需要译者”的挑衅性博客文章,认为MT的质量将不断提高,而且对于许多应用来说,翻译不够完美会很好的。
现在我想了解:
PERSON(Jaap van der Meer) is JOB(founder and director) of ORGANISATION (TAUS)
我从Standford OpenIE和OpenIE得到的是:
TAUS has founder
Jaap van der Meer wrote blogpost
总的来说,我想从新闻文章等自由文本中提取组织和组织,人员和组织之间的工作岗位/业务关系。
如何使用Stanford OpenIE? 有没有更好的工具呢?
答案 0 :(得分:3)
您应该尝试使用KBPAnnotator。这将提取(人,职称,职称)关系和(人,组织,工作_for)关系等。
示例命令:
java -Xmx8g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,regexner,parse,mention,entitymentions,coref,kbp -file example.txt -outputFormat text