使用聚合框架使用MongoDB进行组计数

时间:2012-11-05 20:42:28

标签: mongodb aggregation-framework

假设我的MongoDB架构如下所示:

{car_id: "...", owner_id: "..."}

这是一种多对多的关系。例如,数据可能如下所示:

+-----+----------+--------+
| _id | owner_id | car_id |
+-----+----------+--------+
|   1 |        1 |      1 |
|   2 |        1 |      2 |
|   3 |        1 |      3 |
|   4 |        2 |      1 |
|   5 |        2 |      2 |
|   6 |        3 |      4 |
|   7 |        3 |      5 |
|   8 |        3 |      6 |
|   9 |        3 |      7 |
|  10 |        1 |      1 | <-- not unique
+-----+----------+--------+

我想获得每个所有者拥有的汽车数量。在SQL中,这可能如下所示:

SELECT owner_id, COUNT(*) AS cars_owned
FROM (SELECT owner_id FROM car_owners GROUP BY owner_id, car_id) AS t
GROUP BY owner_id;

在这种情况下,结果如下所示:

+----------+------------+
| owner_id | cars_owned |
+----------+------------+
|        1 |          3 |
|        2 |          2 |
|        3 |          4 |
+----------+------------+

如何使用聚合框架使用MongoDB完成同样的事情?

2 个答案:

答案 0 :(得分:71)

为了适应潜在的重复项,您需要使用两个$group操作:

db.test.aggregate([
    { $group: {
        _id: { owner_id: '$owner_id', car_id: '$car_id' }
    }},
    { $group: {
        _id: '$_id.owner_id',
        cars_owned: { $sum: 1 }
    }},
    { $project: {
        _id: 0,
        owner_id: '$_id',
        cars_owned: 1
    }}]
    , function(err, result){
        console.log(result);
    }
);

给出格式为的结果:

[ { cars_owned: 2, owner_id: 10 },
  { cars_owned: 1, owner_id: 11 } ]

答案 1 :(得分:0)

$group类似于SQL Group by命令。在下面的例子中,我们将根据它们成立的年份来汇总公司。并计算每家公司的平均员工人数。


db.companies.aggregate([{
    $group: {
      _id: {
        founded_year: "$founded_year"
      },
      average_number_of_employees: {
        $avg: "$number_of_employees"
      }
    }
  }, {
    $sort: {
      average_number_of_employees: -1
    }
  }
])

$avg operator MongoDB

此汇总管道有两个阶段

  1. $group
  2. $sort
  3. 现在,$group阶段的基础是_id字段,我们将其指定为文档的一部分。这是$group运算符本身的值,它使用了对arrogation框架语法的非常严格的解释。 _id是我们如何定义,我们如何控制,我们如何调整小组阶段用于组织其所看到的文档的内容。

    以下查询使用$sum运算符查找人与公司的关系:

    
    db.companies.aggregate([{
      $match: {
        "relationships.person": {
          $ne: null
        }
      }
    }, {
      $project: {
        relationships: 1,
        _id: 0
      }
    }, {
      $unwind: "$relationships"
    }, {
      $group: {
        _id: "$relationships.person",
        count: {
          $sum: 1
        }
      }
    }, {
      $sort: {
        count: -1
      }
    }])

    $sum in MongoDB