Elasticsearch中的频率上限和

时间:2016-02-11 15:47:40

标签: java elasticsearch groovy

在Elasticsearch中,我索引了以下格式的文档:

{
  "device_id": "abc",
  "views": 123,
  + other criteria
}

我可以计算:

如何计算视图总和,以便特定设备最多只能占n次观看次数?

例如,如果我的文档是:

{"device_id": "a", "views": 3, ...}
{"device_id": "a", "views": 4, ...}
{"device_id": "a", "views": 1, ...}
{"device_id": "b", "views": 2, ...}
{"device_id": "c", "views": 6, ...}

我的n5,结果应为12 =(a为5,即使b的总数为8 + 2 + c

我的索引包含~500,000个不同的设备。

结果不需要精确,可以在合理范围内近似

我不介意使用我自己的脚本使用技术组合(HLL,Count-Min Sketch,Bloomfilters,Min Hash,......)

0 个答案:

没有答案