我有一些看起来像
的测试文档"hits": {
...
"_source": {
"student": "DTWjkg",
"name": "My Name",
"grade": "A"
...
"student": "ggddee",
"name": "My Name2",
"grade": "B"
...
"student": "ggddee",
"name": "My Name3",
"grade": "A"
我想得到B级成绩的学生百分比,结果将是" 33%"假设只有3名学生。
我如何在Elasticsearch中执行此操作?
到目前为止,我有这个聚合,我觉得它很接近:
"aggs": {
"gradeBPercent": {
"terms": {
"field" : "grade",
"script" : "_value == 'B'"
}
}
}
返回:
"aggregations": {
"gradeBPercent": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": "false",
"doc_count": 2
},
{
"key": "true",
"doc_count": 1
}
]
}
}
我看起来并不一定要找到确切的答案,也许我可以用google来解释这些术语和关键词。我已经阅读了弹性搜索文档,但没有找到任何有用的文章。
答案 0 :(得分:3)
首先,您不需要此聚合的脚本。如果你想把你的结果限制在`value =='B'的每个人那么你应该使用过滤器而不是脚本来做。
ElasticSearch不会准确地返回百分比,但您可以使用 TERMS AGGREGATION 的结果轻松计算出来。
示例:
GET devdev/audittrail/_search
{
"size": 0,
"aggs": {
"a1": {
"terms": {
"field": "uIDRequestID"
}
}
}
}
返回:
{
"took": 12,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 25083,
"max_score": 0,
"hits": []
},
"aggregations": {
"a1": {
"doc_count_error_upper_bound": 9,
"sum_other_doc_count": 1300,
"buckets": [
{
"key": 556,
"doc_count": 34
},
{
"key": 393,
"doc_count": 28
},
{
"key": 528,
"doc_count": 15
}
]
}
}
}
那回报是什么意思呢?
hits.total
字段是与您的查询匹配的记录总数。doc_count
告诉您每个存储桶中有多少项。 所以我的例子在这里:我可以说密钥“556”出现在25083个文档中的34个中,所以它的百分比为(34/25083)* 100