为搜索文章生成概念和概念图的工具

时间:2016-01-15 16:15:46

标签: search elasticsearch machine-learning search-engine information-retrieval

当使用某些在线图书馆(如Springer)搜索论文时,返回的结果还将显示从本文中自动提取的相关概念以及基于这些概念的一些知识关系图。以下是搜索输出的屏幕截图。

我想知道哪种算法和软件能够生成这种输出。是否有任何开源工具能够做到这一点?

enter image description here

1 个答案:

答案 0 :(得分:0)

使用的算法是K-Means。 K-Means是一种无监督的聚类算法。文章按主题聚类。有些文章包含多个主题,其中许多是相同的文章。那些共享的主题是从最初的主题出现的分支。 SKLearn是一个很棒的Python库,可以很好地进行聚类。 R也非常适合聚类。希望这有帮助!