假设我的MongoDB架构如下所示:
{car_id: "...", owner_id: "..."}
这是一种多对多的关系。例如,数据可能如下所示:
+-----+----------+--------+
| _id | owner_id | car_id |
+-----+----------+--------+
| 1 | 1 | 1 |
| 2 | 1 | 2 |
| 3 | 1 | 3 |
| 4 | 2 | 1 |
| 5 | 2 | 2 |
| 6 | 3 | 4 |
| 7 | 3 | 5 |
| 8 | 3 | 6 |
| 9 | 3 | 7 |
| 10 | 1 | 1 | <-- not unique
+-----+----------+--------+
我想获得每个所有者拥有的汽车数量。在SQL中,这可能如下所示:
SELECT owner_id, COUNT(*) AS cars_owned
FROM (SELECT owner_id FROM car_owners GROUP BY owner_id, car_id) AS t
GROUP BY owner_id;
在这种情况下,结果如下所示:
+----------+------------+
| owner_id | cars_owned |
+----------+------------+
| 1 | 3 |
| 2 | 2 |
| 3 | 4 |
+----------+------------+
如何使用聚合框架使用MongoDB完成同样的事情?
答案 0 :(得分:71)
为了适应潜在的重复项,您需要使用两个$group
操作:
db.test.aggregate([
{ $group: {
_id: { owner_id: '$owner_id', car_id: '$car_id' }
}},
{ $group: {
_id: '$_id.owner_id',
cars_owned: { $sum: 1 }
}},
{ $project: {
_id: 0,
owner_id: '$_id',
cars_owned: 1
}}]
, function(err, result){
console.log(result);
}
);
给出格式为的结果:
[ { cars_owned: 2, owner_id: 10 },
{ cars_owned: 1, owner_id: 11 } ]
答案 1 :(得分:0)
$group
类似于SQL Group by命令。在下面的例子中,我们将根据它们成立的年份来汇总公司。并计算每家公司的平均员工人数。
db.companies.aggregate([{
$group: {
_id: {
founded_year: "$founded_year"
},
average_number_of_employees: {
$avg: "$number_of_employees"
}
}
}, {
$sort: {
average_number_of_employees: -1
}
}
])
此汇总管道有两个阶段
$group
$sort
现在,$group
阶段的基础是_id
字段,我们将其指定为文档的一部分。这是$group
运算符本身的值,它使用了对arrogation框架语法的非常严格的解释。 _id
是我们如何定义,我们如何控制,我们如何调整小组阶段用于组织其所看到的文档的内容。
以下查询使用$sum
运算符查找人与公司的关系:
db.companies.aggregate([{
$match: {
"relationships.person": {
$ne: null
}
}
}, {
$project: {
relationships: 1,
_id: 0
}
}, {
$unwind: "$relationships"
}, {
$group: {
_id: "$relationships.person",
count: {
$sum: 1
}
}
}, {
$sort: {
count: -1
}
}])