如何用php计算mongo集合中的文档元素?

时间:2012-05-21 14:55:02

标签: mongodb mongodb-query nosql

我有一个mongo文档的以下结构:

{
 "_id": ObjectId("4fba2558a0787e53320027eb"),
 "replies": {
    "0": {
      "email": ObjectId("4fb89a181b3129fe2d000000"),
      "sentDate": "2012-05-21T11: 22: 01.418Z" 
    } 
    "1": {
     "email": ObjectId("4fb89a181b3129fe2d000000"),
     "sentDate": "2012-05-21T11: 22: 01.418Z" 
    } 
    "2" ....
 }

}

如何计算集合中所有文档的所有回复? 谢谢!

4 个答案:

答案 0 :(得分:5)

在下面的回答中,我正在处理一个简单的数据集,其中包含五个回复:

> db.foo.find()
{ "_id" : ObjectId("4fba6b0c7c32e336fc6fd7d2"), "replies" : [ 1, 2, 3 ] }
{ "_id" : ObjectId("4fba6b157c32e336fc6fd7d3"), "replies" : [ 1, 2 ] }

由于我们不仅仅是计算文件,db.collection.count()在这里无法帮助我们。我们需要求助于MapReduce来扫描每个文档并聚合回复数组长度。请考虑以下事项:

db.foo.mapReduce(
    function() { emit('totalReplies', { count: this.replies.length }); },
    function(key, values) {
        var result = { count: 0 };
        values.forEach(function(value) {
            result.count += value.count;
        });
        return result;
    },
    { out: { inline: 1 }}
);

map函数(第一个参数)在整个集合中运行,并在常量键下发出每个文档中的回复数。然后Mongo会考虑所有发出的值并多次运行reduce函数(第二个参数)来合并(字面上减少)结果。希望这里的代码很简单。如果你是map / reduce的新手,有一点需要注意,reduce方法必须能够处理自己的输出。这在上面链接的MapReduce文档中有详细解释。

注意:如果您的集合非常大,您可能必须使用其他输出模式(例如集合输出);但是,inline适用于小型数据集。

最后,如果您正在使用MongoDB 2.1+,我们可以利用Aggregation Framework来避免编写JS函数并使其更容易:

db.foo.aggregate(
    { $project: { replies: 1 }},
    { $unwind: "$replies" },
    { $group: {
        _id: "result",
        totalReplies: { $sum: 1 }
    }}
);

这里发生了三件事。首先,我们告诉Mongo我们对replies字段感兴趣。其次,我们想要展开数组,以便我们可以遍历投影中的所有元素。最后,我们将在“结果”桶(任何常量都可以)下计算结果,并为每次迭代的1结果添加totalReplies。执行此查询将产生以下结果:

{
    "result" : [{
        "_id" : "result",
        "totalReplies" : 5
    }],
    "ok" : 1
}

虽然我写了关于Mongo客户端的上述答案,但您应该毫不费力地将它们翻译成PHP。您需要使用MongoDB::command()来运行MapReduce或聚合查询,因为PHP驱动程序当前没有任何辅助方法。目前PHP文档中有一个MapReduce示例,您可以通过相同的方法引用this Google group post来执行聚合查询。

答案 1 :(得分:0)

我没有检查过您的代码,也可以正常工作。我做了以下工作,它只是有效:

$replies = $db->command(
   array(
       "distinct" => "foo",
       "key" => "replies"
        ) 
   );
$all = count($replies['values']); 

答案 2 :(得分:0)

我已经使用PHP Mongo Driver的group命令再次执行了此操作。它类似于MapReduce命令。

$keys = array("replies.type" => 1); //keys for group by
$initial = array("count" => 0); //initial value of the counter
$reduce = "function (obj, prev) { prev.count += obj.replies.length; }";
$condition = array('replies' => array('$exists' => true), 'replies.type' => 'follow');
$g = $db->foo->group($keys, $initial, $reduce, $condition);
echo $g['count'];

感谢jmikola提供给Mongo的链接。

答案 3 :(得分:0)

JSON应该是

{
  "_id": ObjectId("4fba2558a0787e53320027eb"),
  "replies":[
             {
             0: {
                     "email": ObjectId("4fb89a181b3129fe2d000000"),
                     "sentDate": "2012-05-21T11: 22: 01.418Z" 
                 }, 
             1: {
                     "email": ObjectId("4fb89a181b3129fe2d000000"),
                     "sentDate": "2012-05-21T11: 22: 01.418Z" 
                }, 
             2: {....}
           ]

}