如何使用mongo聚合计算不同文档的值之间的差异?

时间:2014-10-29 13:55:03

标签: mongodb mongodb-query aggregation-framework

我的mongo结构如下

{
"timemilliSec":1414590255,
"data":[
    {
    "x":23,
    "y":34,
    "name":"X"
    },
    {
    "x":32,
    "y":50,
    "name":"Y"
    }
    ]
},
{
"timemilliSec":1414590245,
"data":[
    {
    "x":20,
    "y":13,
    "name":"X"
    },
    {
    "x":20,
    "y":30,
    "name":"Y"
    }
    ]
}

现在我想用这种方式计算第一文档和第二文档的差异以及第二到第三文档的差异 所以计算如下

diffX = ((data.x-data.x)/(data.y-data.y)) in our case ((23-20)/(34-13))
diffY = ((data.x-data.x)/(data.y-data.y)) in our case ((32-20)/(50-30))

1 个答案:

答案 0 :(得分:6)

原则上是一个严峻的问题,但我将继续介绍两个文件的简化案例,并围绕这个问题提出解决方案。概念应该是抽象的,但对于扩展的案例来说更难。通常可以使用aggregation framework

db.collection.aggregate([
    // Match the documents in a pair
    { "$match": {
        "timeMilliSec": { "$in": [ 1414590255, 1414590245 ] }
    }}

    // Trivial, just keeping an order
    { "$sort": { "timeMilliSec": -1 } },

    // Unwind the arrays
    { "$unwind": "$data" },

    // Group first and last
    { "$group": {
        "_id": "$data.name",
        "firstX": { "$first": "$data.x" },
        "lastX": { "$last": "$data.x" },
        "firstY": { "$first": "$data.y" },
        "lastY": { "$last": "$data.y" }
    }},

    // Difference on the keys
    { "$project": {
        "diff": {
            "$divide": [
                { "$subtract": [ "$firstX", "$lastX" ] },
                { "$subtract": [ "$firstY", "$lastY" ] }
            ]
        }
    }},

    // Not sure you want to take it this far
    { "$group": {
        "_id": null,
        "diffX": { 
            "$min": {
                "$cond": [
                     { "$eq": [ "$_id", "X" ] },
                     "$diff",
                     false
                 ]
            }
        },
        "diffY": { 
            "$min": {
                "$cond": [
                     { "$eq": [ "$_id", "Y" ] },
                     "$diff",
                     false
                 ]
            }
        }
    }}
])

可能过分夸大,不确定意图,但基于样本的输出将是:

{ 
    "_id" : null, 
    "diffX" : 0.14285714285714285, 
    "diffY" : 0.6 
}

哪个与计算相符。

您可以适应您的情况,但一般原则如图所示。

最后一个“管道”阶段有一点“极端”,因为所做的就是将结果合并到一个文档中。否则,“X”和“Y”结果已在管道中的两个文档中获得。主要通过$group操作$first$last操作来查找分组边界上的相应元素。

作为管道阶段的$project中的后续操作执行所需的数学运算以确定不同的结果。有关详细信息,请参阅aggregation operators,尤其是$divide$subtract

无论你做什么,你都遵循这门课程。在两把钥匙上获得“开始”和“结束”对。然后执行计算。