在MongoDB中修改所有文档的字段时间格式的有效方法

时间:2015-05-26 09:58:19

标签: python ruby mongodb mongodb-update

我有一个包含三亿个文档的集合。 每个文档都有一个“created_at”字段,以字符串格式指定时间 '星期二2月05日09:25:38 +0000 2015'

我想将所有“created_at”字段更改为MongoDB支持的时间格式。 所以我写了一个简单的Ruby脚本:

collection.find.each do |document|
  document[:created_at] = Time.parse document[:created_at]
  collection.save(document)
end

它确实改变了我希望的时间格式,但我的脚本已经运行了50个小时,并且没有完成的迹象。

有没有更好的方法来完成这项任务? 我也可以使用MongoDB shell脚本或Python脚本。

顺便说一下,这个集合没有编入索引,因为它不断插入文档

1 个答案:

答案 0 :(得分:2)

使用mongo bulk update您可以将日期更改为ISODATE格式,如下所示:

var bulk = db.collectionName.initializeOrderedBulkOp();
var counter = 0;
db.collectionName.find().forEach(function(data) {
    var updoc = {
      "$set": {}
    };
    var myKey = "created_at";
    updoc["$set"][myKey] = new Date(Date.parse(data.created_at));
    // queue the update
    bulk.find({
      "_id": data._id
    }).update(updoc);
    counter++;
    // Drain and re-initialize every 1000 update statements
    if(counter % 1000 == 0) {
      bulk.execute();
      bulk = db.collectionName.initializeOrderedBulkOp();
    }
  })
  // Add the rest in the queue
if(counter % 1000 != 0) bulk.execute();