ElasticSearch从数组字段中过滤聚合

时间:2015-01-06 20:09:27

标签: elasticsearch

我正在尝试对数组中的值进行聚合,并过滤前缀返回的存储区。不确定这是否可行或我是否滥用过滤器桶。

3份文件:

{ "colors":["red","black","blue"] }
{ "colors":["red","black"] }
{ "colors":["red"] }

目标是计算一个颜色以字母B开头的文件:

{
  "size":0,
  "aggs" : {
    "colors" : {
      "filter" : { "prefix" : { "colors" : "b" } },
      "aggs" : {
        "top-colors" : { "terms" : { "field":"colors" } }
      }
    }
  }
}

不幸的是,返回的结果包括Red。显然因为带有红色的文档仍然匹配过滤器,因为它们也有蓝色和/或黑色。

"aggregations": {
"colors": {
  "doc_count": 2,
  "top-colors": {
    "buckets": [
      {
        "key": "black",
        "doc_count": 2
      },
      {
        "key": "red",
        "doc_count": 2
      },
      {
        "key": "blue",
        "doc_count": 1
      }
    ]
  }
}
}

有没有办法过滤桶结果?

1 个答案:

答案 0 :(得分:8)

试试这个,它会过滤为自己创建的桶本身的值:

{
  "size": 0,
  "aggs": {
    "colors": {
      "filter": {
        "prefix": {
          "colors": "b"
        }
      },
      "aggs": {
        "top-colors": {
          "terms": {
            "field": "colors",
            "include": {
              "pattern": "b.*"
            }
          }
        }
      }
    }
  }
}