要聚类的文档的最大限制

时间:2014-02-27 07:41:54

标签: elasticsearch carrot2

使用弹性搜索通过carrot2插件进行聚类时是否存在文档限制。

这就像我们可以使用carrot2聚类最大10000个文档那样有这样的限制吗?

1 个答案:

答案 0 :(得分:0)

Carrot2旨在实时聚集中小型文档集。典型的范围是几百个文档。 Lingo算法的合理最大值是大约1k个文档,STC算法应该能够处理最多大约10k个文档。如果您想超越它,您可能还想查看the commercial Lingo3G algorithm that plugs into Carrot2

话虽如此,在对搜索结果进行聚类时,搜索引擎首先需要获取所有要聚类的文档的内容,这可能也需要一些时间。