按天汇总时如何计算空桶数?

时间:2017-10-21 16:44:21

标签: elasticsearch elasticsearch-plugin

我想知道一个人在五月份住在城里的天数(Month等于5)。

这是我的查询,但它为我提供了myindexPersonID等于111Month等于5的条目数。例如,这查询可能会给我一个90的输出,但每月最多31天。

GET myindex/_search?
{
 "size":0,
 "query": {
    "bool": {
      "must": [
        { "match": {
          "PersonID": "111"
        }},
        { "match": {
          "Month": "5"
        }}
      ]
    } },
   "aggs": {
    "stay_days": {
     "terms" : {
      "field": "Month"
     }
    }
   }
}

myindex中,我有像DateTime这样的字段,其中包含一个人通过相机注册的日期和时间,例如2017-05-01T00:30:08"。因此,在一天内,同一个人可能会经过几次相机,但它应该算作1。

如何更新我的查询以计算每月的天数而不是相机拍摄的数量?

1 个答案:

答案 0 :(得分:0)

假设您的DateTime字段名为datetime,请考虑的一种方法是DateHistogram聚合:

{
  "size": 0,
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "PersonID": "111"
          }
        },
        {
          "range": {
            "datetime": {
              "gte": "2017-05-01",
              "lt": "2017-06-01"
            }
          }
        }
      ]
    }
  },
  "aggregations": {
    "my_day_histogram": {
      "date_histogram": {
        "field": "datetime",
        "interval": "1d",
        "min_doc_count": 1
      }
    }
  }
}
  • 请注意,在must条款中,我使用了range字段和datetime字段(不是必需的,但您可以认为Month字段是多余的)。此外,您可能需要将范围术语中的日期格式编辑为映射
  • my_day_histogram :通过设置"interval": "1d"将数据划分为不同日期的存储区。
  • "min_doc_count": 1删除存储桶包含零文档。

其他方法,删除第5个月的范围/匹配并扩展一年中每一天的直方图。 这也可以与月直方图汇总,如下:

  "aggregations": {
    "my_month_histogram": {
      "date_histogram": {
        "field": "first_timestamp",
        "interval": "1M",
        "min_doc_count": 1
      },
      "aggregations": {
        "my_day_histogram": {
          "date_histogram": {
            "field": "first_timestamp",
            "interval": "1d"
          }
        }
      }
    }
  }

我清楚地知道,在两种方式中,你都需要计算表示天数的桶数。