我的索引中有1000万个文档,实际上可以总结为几千个文档,但是我需要知道如何。
示例字段:
remote ip , endpoint , number of requests
基于相似的remote ip
和endpoint
,字段number of requests
可以聚合,例如,我有一个行/文档,例如,用于1000个请求,而不是1000有1个请求的文档,我只能有1000个rquests的文档:
<remote ip> , <endpoint> , 1000
如何汇总数据以减少文档数量和索引大小。
注意:原始数据无法以汇总形式重新输入。