获取Elasticsearch中的值百分比

时间:2016-02-25 22:00:20

标签: elasticsearch aggregation

我有一些看起来像

的测试文档
"hits": {
        ...
            "_source": {
               "student": "DTWjkg",
               "name": "My Name",
               "grade": "A"
            ...
               "student": "ggddee",
               "name": "My Name2",
               "grade": "B"
            ...
               "student": "ggddee",
               "name": "My Name3",
               "grade": "A"

我想得到B级成绩的学生百分比,结果将是" 33%"假设只有3名学生。

我如何在Elasticsearch中执行此操作?

到目前为止,我有这个聚合,我觉得它很接近:

"aggs": {
    "gradeBPercent": {
        "terms": {
            "field" : "grade",
            "script" : "_value == 'B'"
        }
    }
}

返回:

"aggregations": {
      "gradeBPercent": {
         "doc_count_error_upper_bound": 0,
         "sum_other_doc_count": 0,
         "buckets": [
            {
               "key": "false",
               "doc_count": 2
            },
            {
               "key": "true",
               "doc_count": 1
            }
         ]
      }
   }

我看起来并不一定要找到确切的答案,也许我可以用google来解释这些术语和关键词。我已经阅读了弹性搜索文档,但没有找到任何有用的文章。

1 个答案:

答案 0 :(得分:3)

首先,您不需要此聚合的脚本。如果你想把你的结果限制在`value =='B'的每个人那么你应该使用过滤器而不是脚本来做。

ElasticSearch不会准确地返回百分比,但您可以使用 TERMS AGGREGATION 的结果轻松计算出来。

示例:

GET devdev/audittrail/_search
{
  "size": 0,
  "aggs": {
    "a1": {
      "terms": {
        "field": "uIDRequestID"
      }
    }
  }
}

返回:

{
  "took": 12,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 25083,
    "max_score": 0,
    "hits": []
  },
  "aggregations": {
    "a1": {
      "doc_count_error_upper_bound": 9,
      "sum_other_doc_count": 1300,
      "buckets": [
        {
          "key": 556,
          "doc_count": 34
        },
        {
          "key": 393,
          "doc_count": 28
        },
        {
          "key": 528,
          "doc_count": 15
        }
      ]
    }
  }
}

那回报是什么意思呢?

  • hits.total字段是与您的查询匹配的记录总数。
  • doc_count告诉您每个存储桶中有多少项。

所以我的例子在这里:我可以说密钥“556”出现在25083个文档中的34个中,所以它的百分比为(34/25083)* 100