使用Stanford CoreNLP构建知识图

时间:2018-10-21 09:40:51

标签: java stanford-nlp semantic-web

我正在尝试从Wikipedia文章中提取知识图。 为了提取必要的三元组,我正在使用Stanford CoreNLP。不幸的是,三元组的质量不能达到我的预期。

示例:

“约翰·卡尔·弗里德里希·高斯(Johann Carl Friedrich Gauss)是德国数学家和物理学家,在数学和科学的许多领域都做出了重要贡献。高斯有时被称为Princeps数学堂,在数学和科学的许多领域都具有非凡的影响力。” >

(physicist,make contribution to, many field)

哪些技术可以改善我的结果?是否有更好的工具可从文本中挖掘三元组?

1 个答案:

答案 0 :(得分:0)

这是一个用Java编写的解决方案:

https://github.com/sunil3590/artificial-guy

使用斯坦福大学的CoreNLP。根据项目的main method,作者已实现:

  • 共同引用解析
  • 词性标记
  • NER标记
  • 词干
  • 依赖关系解析