Mongo Aggregate:如何与另一个集合中的字段进行比较?

时间:2015-02-12 08:15:47

标签: javascript mongodb aggregation-framework

我正在尝试实现一个从文章集合中收集未读邮件的函数。该系列中的每篇文章都有一个"讨论"带有讨论评论子文档的条目。这种子文档的一个例子是:

{
    "id": NumberLong(7534),
    "user": DBRef("users", ObjectId("...")),
    "dt_create": ISODate("2015-01-26T00:10:44Z"),
    "content": "The discussion comment content"
}

父文档具有以下(部分)结构:

{
    model: {
        id: 17676,
        title: "Article title",
        author: DBRef("users", ObjectId(...)),
        // a bunch of other fields here
    },
    statistics: {
        // Statistics will be stored here (pageviews, etc)
    },
    discussions: [
        // Array of discussion subdocuments, like the one above
    ]
}

每个用户还有一个last_viewed条目,这是一个文档,示例如下:

{
    "17676" : "2015-01-10T00:00:00.000Z",
    "18038" : "2015-01-10T00:00:00.000Z",
    "18242" : "2015-01-20T00:00:00.000Z",
    "18325" : "2015-01-20T00:00:00.000Z"
}

这意味着,对于ID为17676和18038的文章以及2015年1月20日ID为18242和18325的文章,用户已查看2015年1月10日最后一次的讨论评论。

所以我想收集文章文档中的讨论条目,对于ID为17676的文章,我想收集2015-01-10之后创建的讨论条目,对于ID为18242的文章,我想展示2015-01-20之后创建的讨论条目。

已更新

基于Neil Lunn's reply,我到目前为止创建的函数是:

function getUnreadDiscussions(userid) {
    user = db.users.findOne({ 'model.id': userid });
    last_viewed = [];

    for(var i in user.last_viewed) {
        last_viewed.push({
            'id': parseInt(i),
            'dt': user.last_viewed[i]
        });
    }

    result = db.articles.aggregate([
        // For now, collect just articles the user has written
        { $match: { 'model.author': DBRef('users', user._id) } },
        { $unwind: '$discussions' },
        { $project: {
                'model': '$model',
                'discussions': '$discussions',
                'last_viewed': {
                    '$let': {
                        'vars': { 'last_viewed': last_viewed },
                        'in': {
                            '$setDifference': [
                                { '$map': {
                                    'input': '$$last_viewed',
                                    'as': 'last_viewed',
                                    'in': {
                                        '$cond': [
                                            { '$eq': [ '$$last_viewed.id', '$model.id' ] },
                                            '$$last_viewed.dt',
                                            false
                                        ]
                                    }
                                } },
                                [ false ]
                            ]
                        }
                    }
                }
            }
        },
        // To get a scalar instead of a 1-element array:
        { $unwind: '$last_viewed' },
        // Match only those that were created after last_viewed
        { $match: { 'discussions.dt_create': { $gt: '$last_viewed' } } },
        { $project: { 
            'model.id': 1, 
            'model.title': 1, 
            'discussions': 1, 
            'last_viewed': 1 
        } }
    ]);

    return result.toArray();
}

整个$let事件以及之后的$unwind将数据转换为以下部分投影(最后$match已注释掉):

{
    "_id" : ObjectId("54d9af1dca71d8054c8d0ee3"),
    "model" : {
        "id" : NumberLong(18325),
        "title" : "Article title"
    },
    "discussions" : {
        "id" : NumberLong(7543),
        "user" : DBRef("users", ObjectId("54d9ae24ca71d8054c8b4567")),
        "dt_create" : ISODate("2015-01-26T00:10:44Z"),
        "content" : "Some comment here"
    },
    "last_viewed" : ISODate("2015-01-20T00:00:00Z")
},
{
    "_id" : ObjectId("54d9af1dca71d8054c8d0ee3"),
    "model" : {
        "id" : NumberLong(18325),
        "title" : "Article title"
    },
    "discussions" : {
        "id" : NumberLong(7554),
        "user" : DBRef("users", ObjectId("54d9ae24ca71d8054c8b4567")),
        "dt_create" : ISODate("2015-01-26T02:03:22Z"),
        "content" : "Another comment here"
    },
    "last_viewed" : ISODate("2015-01-20T00:00:00Z")
}

到目前为止这里很好。但现在的问题是$match仅选择last_viewed日期之后创建的讨论无效。我得到一个空数组响应。但是,如果我对日期进行硬编码并放入$match: { 'discussions.dt_create': { $gt: ISODate("2015-01-20 00:00:00") } },则可行。但我希望它从last_viewed中获取它。

1 个答案:

答案 0 :(得分:0)

我找到了另一个SO帖子,using the $cmp operator解决了这个问题。

汇总的最后部分是:

[
    { /* $match, $unwind, $project, $unwind as before */ },
    { $project: {
        'model': 1,
        'discussions': 1,
        'last_viewed': 1,
        'compare': {
            $cmp: [ '$discussions.dt_create', '$last_viewed' ]
        }
    } },
    { $match: { 'compare': { $gt: 0 } } }
]

聚合框架很棒,但在解决问题方面需要采用完全不同的方法。希望这对任何人都有帮助!

如果其他人有更好的答案/方法,我会保留这个问题。如果这个答案得到了足够的支持,我会接受这个答案。