我有一个包含3个字段的索引:user_id,count,timestamp。
我希望能够通过user_id聚合计数,这对于弹性搜索很容易,但是,我还希望能够做到的是这个结果数据的百分等级。
这可能吗?
答案 0 :(得分:1)
是的,可以使用 Pipelined Percentiles Bucket Aggregation 来实现,它是一个兄弟管道聚合,用于计算兄弟聚合中指定指标的所有存储桶中的百分位数。指定的度量标准必须为数字,并且兄弟聚合必须是多桶聚合。
percentiles_bucket聚合看起来像这样:
{
"percentiles_bucket": {
"buckets_path": "the_sum"
}
}
以下代码段计算所有月度销售总额的总和:
{
"aggs" : {
"sales_per_month" : {
"date_histogram" : {
"field" : "date",
"interval" : "month"
},
"aggs": {
"sales": {
"sum": {
"field": "price"
}
}
}
},
"sum_monthly_sales": {
"percentiles_bucket": {
"buckets_paths": "sales_per_month>sales",
"percents": [ 25.0, 50.0, 75.0 ]
}
}
}
}
以下可能是回应:
{
"aggregations": {
"sales_per_month": {
"buckets": [
{
"key_as_string": "2015/01/01 00:00:00",
"key": 1420070400000,
"doc_count": 3,
"total_sales": {
"value": 50
},
"t-shirts": {
"doc_count": 2,
"sales": {
"value": 10
}
},
"t-shirt-percentage": {
"value": 20
}
},
{
"key_as_string": "2015/02/01 00:00:00",
"key": 1422748800000,
"doc_count": 2
"total_sales": {
"value": 60
},
"t-shirts": {
"doc_count": 1,
"sales": {
"value": 15
}
},
"t-shirt-percentage": {
"value": 25
}
}
]
}
}
}