从 mongo 集合中获取月份的最后一个条目

时间:2021-03-17 02:13:21

标签: mongodb aggregate

按以下格式说出集合存储数据。每天都会在集合中添加一个新条目。日期采用 ISO 格式。

|id|dt|data|
---
|1|2021-03-17|{key:"A", value:"B"}
...
|1|2021-03-14|{key:"A", value:"B"}
...
|1|2021-02-28|{key:"A", value:"B"}
|1|2021-02-27|{key:"A", value:"B"}
...
|1|2021-02-01|{key:"A", value:"B"}
|1|2021-01-31|{key:"A", value:"B"}
|1|2021-01-30|{key:"A", value:"B"}
...
|1|2021-01-01|{key:"A", value:"B"}
|1|2020-12-31|{key:"A", value:"B"}
...
|1|2020-11-30|{key:"A", value:"B"}
...

我需要有关查询的帮助,该查询为我提供给定时间段内每个月的最后一天。下面是我能够执行的查询,它没有给出当月的最后一天,因为我是按日、月和年对其进行排序的。

db.getCollection('data').aggregate([
    {
      $match: {dt: {$gt: ISODate("2020-01-01")}
    },
    {
      $project: {
        dt: "$dt",
        month: {
          $month: "$dt"
        },
        day: {
          $dayOfMonth: "$dt"
        },
        year: {
          $year: "$dt"
        },
        data: "$data"
      }
    },
    {
        $sort: {day: -1, month: -1, year: -1}
    },
    { $limit: 24},
    {
        $sort: {dt: -1}
    },
])

我追求的结果是:

|1|2021-03-17|{key:"A", value:"B"}
|1|2021-02-28|{key:"A", value:"B"}
|1|2021-01-31|{key:"A", value:"B"}
|1|2020-12-31|{key:"A", value:"B"}
|1|2020-11-30|{key:"A", value:"B"}
...
|1|2020-01-31|{key:"A", value:"B"}

2 个答案:

答案 0 :(得分:2)

按年和月对记录进行分组,获取该月的最大日期。

db.getCollection('data').aggregate([
    { $match: { dt: { $gt: ISODate("2020-01-01") } } },
    { $group: { // group by
      _id: { $substr: ['$dt', 0, 7] }, // get year and month eg 2020-01
      dt: { $max: "$dt" }, // find the max date
      doc:{ "$first" : "$$ROOT" } } // to get the document
    },
    { "$replaceRoot": { "newRoot": "$doc"} }, // project the document
    { $sort: { dt: -1 } }
]);

$substr

$group

$replaceRoot

$max

$first

答案 1 :(得分:0)

我用 Python 为您修补了一个可能的解决方案,但如果没有您的数据库,我不能肯定这是否有效。

首先有一个函数,它接受一个代表一个月的整数并返回该月的最后一天。

import datetime as dt


def last_day_of_month(month):

    return dt.datetime(2021, month+1, 1) - dt.timedelta(days=1)

接下来,我使用单独的函数构建查询。

def build_query(last_month):

    return [
    {
        "$and": [
            {"date": {"$gte": last_day_of_month(i)}},
            {"date": {"$lt": last_day_of_month(i) + dt.timedelta(days=1)}}
        ]
    }
    for i in range(0, last_month)
]

这是输出。它将位于 $or 阶段的 $match 运算符内。

    {'$match': {'$or': [{'$and': [{'date': {'$gte': datetime.datetime(2020, 12, 31, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 1, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 1, 31, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 2, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 2, 28, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 3, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 3, 31, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 4, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 4, 30, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 5, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 5, 31, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 6, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 6, 30, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 7, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 7, 31, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 8, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 8, 31, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 9, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 9, 30, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 10, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 10, 31, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 11, 1, 0, 0)}}]},
   {'$and': [{'date': {'$gte': datetime.datetime(2021, 11, 30, 0, 0)}},
     {'date': {'$lt': datetime.datetime(2021, 12, 1, 0, 0)}}]}]}}