如何使用mongo聚合将字符串转换为日期?

时间:2016-01-17 10:54:40

标签: mongodb date mongoose aggregation-framework

在一个集合中,我存储了这种文件

{
    "_id" : 1,
    "created_at" : "2016/01/01 12:10:10",
    ...
}.
{
    "_id" : 2,
    "created_at" : "2016/01/04 12:10:10",
    ...
}

我想找到的文件有“creared_at”> 2016/01/01使用聚合管道。

任何人都有解决方案将“created_at”转换为日期,以便可以进行聚合吗?

3 个答案:

答案 0 :(得分:6)

正如您所提到的,您需要先更改架构,以便created_at字段保存日期对象而不是字符串,就像当前情况一样,然后您可以使用 {查询集合{3}} 方法或聚合框架。前者是最简单的方法。

要将created_at转换为日期字段,您需要使用 find() find() 方法返回的光标>方法,在循环中将created_at字段转换为Date对象,然后使用 forEach() 运算符更新字段。

利用 $set 进行批量更新,从而提供更好的性能,因为您将以1000个批量向服务器发送操作,从而为您提供更好的性能没有向服务器发送每个请求,每1000个请求只发送一次。

以下演示了此方法,第一个示例使用MongoDB版本>= 2.6 and < 3.2中提供的批量API。它更新所有 通过将created_at字段更改为日期字段来收集集合中的文档:

var bulk = db.collection.initializeUnorderedBulkOp(),
    counter = 0;

db.collection.find({"created_at": {"$exists": true, "$type": 2 }}).forEach(function (doc) {
    var newDate = new Date(doc.created_at);
    bulk.find({ "_id": doc._id }).updateOne({ 
        "$set": { "created_at": newDate}
    });

    counter++;
    if (counter % 1000 == 0) {
        bulk.execute(); // Execute per 1000 operations and re-initialize every 1000 update statements
        bulk = db.collection.initializeUnorderedBulkOp();
    }
})
// Clean up remaining operations in queue
if (counter % 1000 != 0) { bulk.execute(); }

下一个示例适用于自 Bulk API 以来的新MongoDB版本3.2,并使用 deprecated the Bulk API

var cursor = db.collection.find({"created_at": {"$exists": true, "$type": 2 }}),
    bulkOps = [];

cursor.forEach(function (doc) { 
    var newDate = new Date(doc.created_at);
    bulkOps.push(         
        { 
            "updateOne": { 
                "filter": { "_id": doc._id } ,              
                "update": { "$set": { "created_at": newDate } } 
            }         
        }           
    );   

    if (bulkOps.length === 1000) {
        db.collection.bulkWrite(bulkUpdateOps);
        bulkOps = [];
    }
});         

if (bulkOps.length > 0) { db.collection.bulkWrite(bulkOps); }

架构修改完成后,您可以在集合中查询日期:

var dt = new Date("2016/01/01");
db.collection.find({ "created_at": { "$gt": dt } });

如果您希望使用聚合框架进行查询,请运行以下管道以获得所需的结果。它使用 bulkWrite() 运算符,类似于 $match 方法:

var dt = new Date("2016/01/01");
db.collection.aggregate([
    {
        "$match": { "created_at": { "$gt": dt } }
    }
])

答案 1 :(得分:5)

以上所有答案均使用cursors但是,mongodb始终建议使用aggregation管道。使用$dateFromString中的新mongodb 3.6,非常简单。 https://docs.mongodb.com/manual/reference/operator/aggregation/dateFromString/

db.collection.aggregate([
    {$project:{ created_at:{$dateFromString:{dateString:'$created_at'}}}}
])

答案 2 :(得分:1)

如果我们有文件:

db.doc.save({ "_id" : 1, "created_at" : "2016/01/01 12:10:10" })
db.doc.save({ "_id" : 2, "created_at" : "2016/01/04 12:10:10" })

简单查询:

db.doc.find({ "created_at" : {"$lte": Date()} })

汇总查询:

db.doc.aggregate([{ 
     "$match": { "created_at": { "$lte": Date() } }
}])
  
      
  • Date()方法,以字符串形式返回当前日期。
  •   
  • new Date()构造函数,它使用ISODate()包装器返回Date对象。
  •   
  • ISODate()构造函数,它使用ISODate()返回Date对象   包装
  •   

有关日期类型herehere

的详细信息