我有一个索引invoices
,需要将其汇总到年度存储区中然后进行排序。
我成功地使用了Bucket Sort将存储桶按简单的总和值(revenue
和tax
)排序。但是,我正在努力按更深层嵌套的doc_count值(status
)进行排序。
我不仅要按revenue
来排序我的存储桶,还想按status
字段等于1、2、3等的文档数量来排序
索引中的文档如下:
"_source": {
"created_at": "2018-07-07T03:11:34.327Z",
"status": 3,
"revenue": 68.474,
"tax": 6.85,
}
我要求这样的汇总:
const params = {
index: 'invoices',
size: 0,
body: {
aggs: {
sales: {
date_histogram: {
field: 'created_at',
interval: 'year',
},
aggs: {
total_revenue: { sum: { field: 'revenue' } },
total_tax: { sum: { field: 'tax' } },
statuses: {
terms: {
field: 'status',
},
},
sales_bucket_sort: {
bucket_sort: {
sort: [{ total_revenue: { order: 'desc' } }],
},
},
},
},
},
},
}
响应(被截断)如下:
"aggregations": {
"sales": {
"buckets": [
{
"key_as_string": "2016-01-01T00:00:00.000Z",
"key": 1451606400000,
"doc_count": 254,
"total_tax": {
"value": 735.53
},
"statuses": {
"sum_other_doc_count": 0,
"buckets": [
{
"key": 2,
"doc_count": 59
},
{
"key": 1,
"doc_count": 58
},
{
"key": 5,
"doc_count": 57
},
{
"key": 3,
"doc_count": 40
},
{
"key": 4,
"doc_count": 40
}
]
},
"total_revenue": {
"value": 7355.376005351543
}
},
]
}
}
例如,我想按key: 1
进行排序。根据状态值为1的文档数量最多的存储桶进行排序。我试图对术语聚合进行排序,然后指定所需的键,如下所示:
statuses: {
terms: {
field: 'status',
order: { _key: 'asc' },
},
},
sales_bucket_sort: {
bucket_sort: {
sort: [{ 'statuses.buckets[0]._doc_count': { order: 'desc' } }],
},
},
但是,这没有用。它没有错误,似乎没有任何作用。
多年前,我注意到SO上的其他人也有类似的问题,但我希望从那时起会有更好的答案:Elasticsearch aggregation. Order by nested bucket doc_count
谢谢!
答案 0 :(得分:0)
没关系,我想通了。我添加了一个单独的过滤器聚合,如下所示:
aggs: {
total_revamnt: { sum: { field: 'revamnt' } },
total_purchamnt: { sum: { field: 'purchamnt' } },
approved_invoices: {
filter: {
term: {
status: 1,
},
},
},
然后,我能够像这样对值进行排序:
sales_bucket_sort: {
bucket_sort: {
sort: [{ 'approved_invoices>_count': { order: 'asc' } }],
},
},