使用来自另一个集合

时间:2016-04-16 22:02:36

标签: mongodb mongoose mongodb-query aggregation-framework

我正在尝试使用另一个集合中的属性过滤mongodb上的文档,但问题是我需要先获取所有对象然后再进行过滤。这是我目前的情况:

当前数据:

/* Message collection */
/* 1 */
{
    "_id" : ObjectId("571063533e41b42c2753828a"),
    "user" : ObjectId("570ae3d0a27d4cd44730fc38"),
    "text" : "First text",
    "enabled" : true,
    "deleted" : false,
    "__v" : 0
}

/* 2 */
{
    "_id" : ObjectId("5712a9be27adcff81ea5a39f"),
    "user" : ObjectId("5f236vgh74de563swer120rt"),
    "text" : "Second text",
    "deleted" : false,
    "enabled" : true,
    "__v" : 0
}

/* User collection */
/* 1 */
{
    "_id" : ObjectId("570ae3d0a27d4cd44730fc38"),
    "email" : "test@test.com",
    "showMessage" : true,
    "__v" : 0
}

/* 2 */
{
    "_id" : ObjectId("5f236vgh74de563swer120rt"),
    "email" : "test1@test.com",
    "showMessage" : false,
    "__v" : 0
}

当前过滤方式:

Message.aggregate([{
            $match: {
                enabled: true,
                deleted: false
            }
        }, {
            $lookup: {
                from: 'users',
                localField: 'user',
                foreignField: '_id',
                as: 'user'
            }
        }], function(err, messages) {
            if (err) {
                reject(err);
            } else {
                var filteredMessages = this.filterMessages(messages);
                //do other stuff with the filtered data
            }
        });

filterMessages(messages) {
    return messages.filter((current) => {
        return current.user[0].showMessage;
    });
}

正如您所看到的,我正在尝试使用messages中的属性showMessages来获取user,但是在我首先收到所有消息之后我正在执行过滤器这是一种效率低下的方法。

有没有办法只获取我需要的消息,使用其他集合中的属性过滤它们?

注意:我需要使用用户属性过滤所有消息,不是相反,我的意思是,我无法获取用户并在此之后过滤消息。

1 个答案:

答案 0 :(得分:1)

直接在汇总中代替:

Message.aggregate([
  { "$match": {
    "enabled": true,
    "deleted": false  
  }},
  { "$lookup": {
    "from": "users",
    "localField": "user",
    "foreignField": "_id",
    "as": "user"
  }},
  { "$unwind": "user" },
  { "$redact": {
      "if": "$user.showMessage",
      "then": "$$KEEP",
      "else": "$$PRUNE"
  }}
],function(err,messages) {
    if (err) reject(err);
    // Already filtered
})

因此,$unwind单个关系(因为$lookup是"左连接),然后只是$redact,其值为true/false

或反向执行$lookup,这可能更高效:

User.aggregate([
  { "$match": { "showMessage": true } },
  { "$lookup": {
    "from": "messages",
    "localField": "_id",
    "foreignField": "user",
    "as": "messages"
  }},
  { "$unwind": "$messages" },
  { "$match": {
      "messages.enabled": true,
      "messages.deleted": false
  }},
  { "$project": {
    "_id": "$messages._id",
    "user": {
      "_id": "$_id",
      "email": "$email",
      "showMessage": "$showMessage"
    },
    "text": "$messages.text",
    "deleted": "$messages.deleted",
    "enabled": "$messages.enabled"
  }}
],function(err,messages) {

})

目前$lookup运营商本身并没有"查询"基于" local"匹配的任何其他条件的文档和"外国"场地属性。这可能会在以后的版本中发生变化。

现在,你做了更进一步的过滤"在随后的聚合管道阶段。

另一种情况是事实上查询"反向"在哪里获取有效_id数据的User值,然后只检索消息。但是,当然只有$in的结果列表实际上不是太大:

async.waterfall
  [
    function(callback) {
      User.find({ "showMesage": true }).select("_id").exec(callback);
    },
    function(users,callback) {
      Message.find({
        "user": { "$in": users.map((current) => { return current._id }) },
        "enabled": true,
        "deleted": false
      }).populate("user").exec(callback);
    }
  ],function(err,messages) {
    // filter and populated
  }
)

$lookup相比,它提出了额外的查询,但它在最终匹配时处理的结果较少。

这实际上取决于你的数据最适合哪种情况,所以你真的应该测试它。我的猜测会说"反向"使用$lookup的集合选择或仅使用$in的后一种情况将是更好的选择。但这实际上取决于哪个查询产生的结果最少,哪个"顺序"是最好的。