奇怪的MongoDB MapReduce ObjectId.toString()行为?

时间:2012-08-09 09:46:49

标签: mongodb mapreduce mongohq

我在MongoHQ上运行的mongodb和我自己的开发机器上运行的版本之间遇到了一些奇怪的差异。具体来说,当在MapReduce地图函数内的对象id上调用.toString()时,结果会有所不同:

在我自己的机器上:

ObjectId('foo').toString()  // => 'foo'

On MongoHQ:

ObjectId('foo').toString()  // => 'ObjectId(\'foo\')'

注意:我使用的id是实际的mongodb id - 而不仅仅是'foo'等,就像在这些例子中一样

我希望.toString()在我自己的机器上表现得像 - 而不是它在MongoHQ上的表现。怎么没有?

我的本​​地OSX版MongoDB使用Homebrew安装,版本为2.0.1-x86_64

为了展示实际发生的事情,我构建了一个小测试用例。假设我们有一个users集合,其friends属性是一个用户ID数组:

> db.users.find()
{ _id: ObjectId('a'), friends: [ObjectId('b'), ObjectId('c')] },
{ _id: ObjectId('b'), friends: [] },
{ _id: ObjectId('c'), friends: [] }

正如您所看到的,abc的朋友,其中bc不是任何人的朋友。

现在让我们看看一个有效的测试算法:

var map = function() {
  this.friends.forEach(function(f) {
    emit(f, { friends: 1, user: user, friend: f.toString() });
  });
};

var reduce = function(k, vals) {
  var result = { friends: 0, user: [], friend: [] };

  vals.forEach(function(val) {
    result.friends += val.friends;
    result.user.push(val.user);
    result.friend.push(val.friend);
  });

  return result;
};

var id = ObjectId('50237c6d5849260996000002');

var query = {
  query   : { friends: id },
  out     : { inline: 1 },
  scope   : { user: id.toString() },
  jsMode  : true,
  verbose : true
};

db.users.mapReduce(map, reduce, query);

假设id设置为users集合中某人朋友的用户的id,那么MongoHQ上mapReduce方法返回的输出将如下所示:

{
  "results" : [
    {
      "_id" : ObjectId("50237c555849260996000001"),
      "value" : {
        "friends" : 1,
        "user" : "50237c6d5849260996000002",
        "friend" : "ObjectId(\"50237c555849260996000001\")"
      }
    },
    {
      "_id" : ObjectId("50237c74c271be07f6000002"),
      "value" : {
        "friends" : 1,
        "user" : "50237c6d5849260996000002",
        "friend" : "ObjectId(\"50237c74c271be07f6000002\")"
      }
    }
  ],
  "timeMillis" : 0,
  "timing" : {
    "mapTime" : 0,
    "emitLoop" : 0,
    "reduceTime" : 0,
    "mode" : "mixed",
    "total" : 0
  },
  "counts" : {
    "input" : 1,
    "emit" : 2,
    "reduce" : 0,
    "output" : 2
  },
  "ok" : 1,
}

如您所见,每个结果中的friend属性不仅仅是包含id的字符串,而是包含实际方法调用的字符串。

我是否在自己的机器上运行它,结果数组应该是:

{
  "_id" : ObjectId("50237c555849260996000001"),
  "value" : {
    "friends" : 1,
    "user" : "50237c6d5849260996000002",
    "friend" : "50237c555849260996000001"
  }
},
{
  "_id" : ObjectId("50237c74c271be07f6000002"),
  "value" : {
    "friends" : 1,
    "user" : "50237c6d5849260996000002",
    "friend" : "50237c74c271be07f6000002"
  }
}

1 个答案:

答案 0 :(得分:1)

MongoHQ正在运行与您不同的MongoDB版本。

要获取自制程序版本的行为,请尝试更改地图功能:

var map = function() {
  this.friends.forEach(function(f) {
    emit(f, { friends: 1, user: user.str, friend: f.str });
  });
};