我想知道一个人在五月份住在城里的天数(Month
等于5)。
这是我的查询,但它为我提供了myindex
中PersonID
等于111
且Month
等于5的条目数。例如,这查询可能会给我一个90的输出,但每月最多31天。
GET myindex/_search?
{
"size":0,
"query": {
"bool": {
"must": [
{ "match": {
"PersonID": "111"
}},
{ "match": {
"Month": "5"
}}
]
} },
"aggs": {
"stay_days": {
"terms" : {
"field": "Month"
}
}
}
}
在myindex
中,我有像DateTime
这样的字段,其中包含一个人通过相机注册的日期和时间,例如2017-05-01T00:30:08"
。因此,在一天内,同一个人可能会经过几次相机,但它应该算作1。
如何更新我的查询以计算每月的天数而不是相机拍摄的数量?
答案 0 :(得分:0)
假设您的DateTime
字段名为datetime
,请考虑的一种方法是DateHistogram聚合:
{
"size": 0,
"query": {
"bool": {
"must": [
{
"match": {
"PersonID": "111"
}
},
{
"range": {
"datetime": {
"gte": "2017-05-01",
"lt": "2017-06-01"
}
}
}
]
}
},
"aggregations": {
"my_day_histogram": {
"date_histogram": {
"field": "datetime",
"interval": "1d",
"min_doc_count": 1
}
}
}
}
must
条款中,我使用了range字段和datetime
字段(不是必需的,但您可以认为Month
字段是多余的)。此外,您可能需要将范围术语中的日期格式编辑为映射"interval": "1d"
将数据划分为不同日期的存储区。"min_doc_count": 1
删除存储桶包含零文档。其他方法,删除第5个月的范围/匹配并扩展一年中每一天的直方图。 这也可以与月直方图汇总,如下:
"aggregations": {
"my_month_histogram": {
"date_histogram": {
"field": "first_timestamp",
"interval": "1M",
"min_doc_count": 1
},
"aggregations": {
"my_day_histogram": {
"date_histogram": {
"field": "first_timestamp",
"interval": "1d"
}
}
}
}
}
我清楚地知道,在两种方式中,你都需要计算表示天数的桶数。