如何在数组元素的索引上分组文档?

时间:2016-04-28 22:28:59

标签: mongodb mapreduce mongodb-query aggregation-framework

我正在寻找一种获取此类数据的方法

{ "_id" : 5, "count" : 1, "arr" : [ "aga", "dd", "a" ] },
{ "_id" : 6, "count" : 4, "arr" : [ "aga", "ysdf" ] },
{ "_id" : 7, "count" : 4, "arr" : [ "sad", "aga" ] }

我想根据arr的第1项(索引)计算总数。在另一个聚合中,我想对arr数组中的第一个和第二个项目做同样的事情。

我尝试过使用unwind,但这会破坏数据,然后层次结构就会丢失。

我也尝试过使用

$group: {
    _id: {
        arr_0:'$arr.0'
    },
    total:{
        $sum: '$count'
    }
}

但结果是空白数组

1 个答案:

答案 0 :(得分:3)

实际上,您无法使用dot notation按指定索引的元素对文档进行分组。对于两个你有两个选择:

首先使用MongoDB 3.2中$arrayElemAt运算符new的最佳方式。它返回数组中指定索引处的元素。

db.collection.aggregate([
    { "$group": {
        "_id": { "$arrayElemAt": [ "$arr", 0 ] }, 
        "count": { "$sum": 1 }
    }}
])

从MongoDB 3.0版向后,您需要在第一次$group _id之前对数组进行反规范化,并使用$first运算符返回数组中的第一项。从那里,您需要使用该值重新组合文档,并使用$sum获取总和。但这只适用于第一个和最后一个索引,因为MongoDB还提供$last运算符。

db.collection.aggregate([
    { "$unwind": "$arr" }, 
    { "$group": { 
        "_id": "$_id", 
        "arr": { "$first":  "$arr" }
    }}, 
    { "$group": {
        "_id": "$arr", 
        "count": { "$sum": 1 }
    }}
])

产生类似这样的东西:

{ "_id" : "sad", "count" : 1 }
{ "_id" : "aga", "count" : 2 }

要使用数组中位置p的元素进行分组,您将有更好的机会使用mapReduce函数。

var mapFunction = function(){ emit(this.arr[0], 1); };
var reduceFunction = function(key, value) { return Array.sum(value); };
db.collection.mapReduce(mapFunction, reduceFunction, { "out": { "inline": 1 } } )

返回:

{
        "results" : [
                {
                        "_id" : "aga",
                        "value" : 2
                },
                {
                        "_id" : "sad",
                        "value" : 1
                }
        ],
        "timeMillis" : 27,
        "counts" : {
                "input" : 3,
                "emit" : 3,
                "reduce" : 1,
                "output" : 2
        },
        "ok" : 1
}