我有一个mongo文档的以下结构:
{
"_id": ObjectId("4fba2558a0787e53320027eb"),
"replies": {
"0": {
"email": ObjectId("4fb89a181b3129fe2d000000"),
"sentDate": "2012-05-21T11: 22: 01.418Z"
}
"1": {
"email": ObjectId("4fb89a181b3129fe2d000000"),
"sentDate": "2012-05-21T11: 22: 01.418Z"
}
"2" ....
}
}
如何计算集合中所有文档的所有回复? 谢谢!
答案 0 :(得分:5)
在下面的回答中,我正在处理一个简单的数据集,其中包含五个回复:
> db.foo.find()
{ "_id" : ObjectId("4fba6b0c7c32e336fc6fd7d2"), "replies" : [ 1, 2, 3 ] }
{ "_id" : ObjectId("4fba6b157c32e336fc6fd7d3"), "replies" : [ 1, 2 ] }
由于我们不仅仅是计算文件,db.collection.count()在这里无法帮助我们。我们需要求助于MapReduce来扫描每个文档并聚合回复数组长度。请考虑以下事项:
db.foo.mapReduce(
function() { emit('totalReplies', { count: this.replies.length }); },
function(key, values) {
var result = { count: 0 };
values.forEach(function(value) {
result.count += value.count;
});
return result;
},
{ out: { inline: 1 }}
);
map函数(第一个参数)在整个集合中运行,并在常量键下发出每个文档中的回复数。然后Mongo会考虑所有发出的值并多次运行reduce函数(第二个参数)来合并(字面上减少)结果。希望这里的代码很简单。如果你是map / reduce的新手,有一点需要注意,reduce方法必须能够处理自己的输出。这在上面链接的MapReduce文档中有详细解释。
注意:如果您的集合非常大,您可能必须使用其他输出模式(例如集合输出);但是,inline
适用于小型数据集。
最后,如果您正在使用MongoDB 2.1+,我们可以利用Aggregation Framework来避免编写JS函数并使其更容易:
db.foo.aggregate(
{ $project: { replies: 1 }},
{ $unwind: "$replies" },
{ $group: {
_id: "result",
totalReplies: { $sum: 1 }
}}
);
这里发生了三件事。首先,我们告诉Mongo我们对replies
字段感兴趣。其次,我们想要展开数组,以便我们可以遍历投影中的所有元素。最后,我们将在“结果”桶(任何常量都可以)下计算结果,并为每次迭代的1
结果添加totalReplies
。执行此查询将产生以下结果:
{
"result" : [{
"_id" : "result",
"totalReplies" : 5
}],
"ok" : 1
}
虽然我写了关于Mongo客户端的上述答案,但您应该毫不费力地将它们翻译成PHP。您需要使用MongoDB::command()来运行MapReduce或聚合查询,因为PHP驱动程序当前没有任何辅助方法。目前PHP文档中有一个MapReduce示例,您可以通过相同的方法引用this Google group post来执行聚合查询。
答案 1 :(得分:0)
我没有检查过您的代码,也可以正常工作。我做了以下工作,它只是有效:
$replies = $db->command(
array(
"distinct" => "foo",
"key" => "replies"
)
);
$all = count($replies['values']);
答案 2 :(得分:0)
我已经使用PHP Mongo Driver的group命令再次执行了此操作。它类似于MapReduce命令。
$keys = array("replies.type" => 1); //keys for group by
$initial = array("count" => 0); //initial value of the counter
$reduce = "function (obj, prev) { prev.count += obj.replies.length; }";
$condition = array('replies' => array('$exists' => true), 'replies.type' => 'follow');
$g = $db->foo->group($keys, $initial, $reduce, $condition);
echo $g['count'];
感谢jmikola提供给Mongo的链接。
答案 3 :(得分:0)
JSON应该是
{
"_id": ObjectId("4fba2558a0787e53320027eb"),
"replies":[
{
0: {
"email": ObjectId("4fb89a181b3129fe2d000000"),
"sentDate": "2012-05-21T11: 22: 01.418Z"
},
1: {
"email": ObjectId("4fb89a181b3129fe2d000000"),
"sentDate": "2012-05-21T11: 22: 01.418Z"
},
2: {....}
]
}