我正在尝试从Wikipedia文章中提取知识图。 为了提取必要的三元组,我正在使用Stanford CoreNLP。不幸的是,三元组的质量不能达到我的预期。
示例:
“约翰·卡尔·弗里德里希·高斯(Johann Carl Friedrich Gauss)是德国数学家和物理学家,在数学和科学的许多领域都做出了重要贡献。高斯有时被称为Princeps数学堂,在数学和科学的许多领域都具有非凡的影响力。” >
(physicist,make contribution to, many field)
哪些技术可以改善我的结果?是否有更好的工具可从文本中挖掘三元组?
答案 0 :(得分:0)
这是一个用Java编写的解决方案:
https://github.com/sunil3590/artificial-guy
使用斯坦福大学的CoreNLP。根据项目的main
method,作者已实现: