事实
什么效果好
当对公司字段使用 termAggregation 进行聚合时,结果将毫无问题地返回,首先列出符合用户输入的特定条件的大多数文档的公司。 前 6 个 1000 个桶的 doc_counts 示例(设置了 size=1000)
什么不起作用
仅选择具有某些最大和最小大小的存储桶(例如,最小:31000,最大:32000)。这无法在 termAggregation 级别实现,因为此选项不可用。
此处 termAggregation 的唯一选项是“min_doc_count”,但没有“max_doc_count”。
更新:我已经使用此功能 (WIP) 在 ElasticSearch 的 github 上创建了 PR
不是解决方案
标题中的问题:有没有办法用范围过滤器为存储桶的 doc_count 选择 1000 个存储桶,以一种“即时”跳过存储桶的方式应用
假想聚合:
termAgregation("companies", "company").size(10).minDocCount(100).maxDocCount(1000)