通过分类/自然语言/弹性搜索聚合来识别博客帖子的主题

时间:2015-09-17 08:34:05

标签: elasticsearch nlp taxonomy

我想对一组博客文章做一些分析,特别是确定帖子的主题。我们可以假设博客文章是英文的。

数据存储在弹性搜索系统中,因此聚合可能有用吗?

我正在寻找有关如何做到这一点的指导。例如,如果我要探索利用分类集,那么进行映射的好方法是什么?

如果分类法是可行的方法,是否有任何良好的标准分类法可供使用或是否有必要建立自己的分类标准?

提前谢谢!

0 个答案:

没有答案