Elasticsearch:在对多个索引进行分组查询时获得重复数据删除计数

时间:2019-03-05 22:18:21

标签: elasticsearch

我有一个包含每小时索引的Elasticsearch集群。我们会追踪实体,因此如果实体在一小时内存在,我们的应用程序将覆盖相同的实体文档。随着新的时刻到来,应用程序会将相同的实体写入新索引(如果它们仍然存在)。

当我们的查询时间范围跨越两个索引时,就会出现问题。我们不希望同一实体文档在搜索结果中出现两次,一个来自旧索引,另一个来自新索引。对于未分组的查询,这可以通过使用field collapsing来处理,但是已分组的查询几乎总是显示错误的计数。我很确定Elasticsearch对分组查询没有“字段折叠”,但是我想知道是否有解决方法。谢谢。

0 个答案:

没有答案