应用错误收集

使用Stanford CoreNLP构建知识图

时间：2018-10-21 09:40:51

标签： java stanford-nlp semantic-web

我正在尝试从Wikipedia文章中提取知识图。为了提取必要的三元组，我正在使用Stanford CoreNLP。不幸的是，三元组的质量不能达到我的预期。

示例：

“约翰·卡尔·弗里德里希·高斯（Johann Carl Friedrich Gauss）是德国数学家和物理学家，在数学和科学的许多领域都做出了重要贡献。高斯有时被称为Princeps数学堂，在数学和科学的许多领域都具有非凡的影响力。” >

(physicist,make contribution to, many field)

哪些技术可以改善我的结果？是否有更好的工具可从文本中挖掘三元组？

1 个答案:

答案 0 :(得分：0)

这是一个用Java编写的解决方案：

https://github.com/sunil3590/artificial-guy

使用斯坦福大学的CoreNLP。根据项目的main method，作者已实现：

共同引用解析
词性标记
NER标记
词干
依赖关系解析