不同文档中两个数组的MongoDB聚合项数是一样的吗?

时间:2015-08-22 14:44:08

标签: javascript mongodb mongoose mongodb-query aggregation-framework

这是我的MongoDB集合架构:

company: String
model: String
cons: [String] // array of tags that were marked as "cons"
pros: [String] // array of tags that were marked as "pros"

这是我的query

[
    { "$project": {
        "company": 1,
        "model": 1,
        "data": {
            "$setUnion": [
                { "$map": {
                    "input": "$pros",
                    "as": "pro",
                    "in": {
                        "type": "$pro",
                        "value": "$$pro"
                    }
                }},
                { "$map": {
                    "input": "$cons",
                    "as": "con",
                    "in": {
                        "type": "$con",
                        "value": "$$con"
                    }
                }}
            ]
        }
    }},
    { "$unwind": "$data" },
    { "$group": {
      "_id": { 
          "company": "$company",
          "model": "$model",
          "theTag": "$data.value"
      },
      "sumPros": { 
        "$sum": { 
          "$cond": [
            { "$eq": [ "$data.type", "$pro" ] },
              1,
              0
          ]
        }
      },
      "sumCons": { 
        "$sum": { 
          "$cond": [
            { "$eq": [ "$data.type", "$con" ] },
              1,
              0
          ]
        }
      }
    }},
    { "$group": {
        "_id": { 
            "company": "$_id.company",
            "model": "$_id.model",
        },
        "tags": {$push: { 
          "tag": "$_id.theTag", 
          "pros": "$sumPros",
          "cons": "$sumCons"
        }

      }}
}]

这是输出:

{
        "_id": {
            "company": "Lenovo",
            "model": "T400"
        },
        "tags": [
            {
                "tag": "Quality",
                "pros": 64, // expected value is 54
                "cons": 64  // expected value is 10
            },
            {
                "tag": "Value",
                "pros": 76, // expected value is 30
                "cons": 76  // expected value is 46
            }
        ]
}
...

请注意,proscons值相同。出于某种原因,他们代表proscons的总和,我无法弄清楚原因。

我做错了什么?

更新

以下是该系列的文件:

{
  "company": "Lenovo",
  "model": "X200",

  "cons": [
      "Quality"
  ],
  "pros": [
      "Value",
      "Styling"
  ]
}

1 个答案:

答案 0 :(得分:0)

作为您在查询中使用的内容的作者,并且在要求您以实际支持此处问题中的声明的数据形式提交某些信息之后,我不得不说您所说的内容不正确

为了记录,这是您回答时的样本:

{
  "company": "Lenovo",
  "model": "X200",

  "cons": [
      "Quality"
  ],
  "pros": [
      "Value",
      "Styling"
  ]
}

在这里的示例中,如果我运行以下查询(并且我确实在以前的答案中扩展了任何误导性操作的责任并将立即对其进行修改)那么我看到的结果应该是预期的结果:

db.collection.aggregate([
    { "$project": {
        "company": 1,
        "model": 1,
        "data": {
            "$setUnion": [
                { "$map": {
                    "input": "$cons",
                    "as": "con",
                    "in": {
                        "type": { "$literal": "con" },
                        "value": "$$con"
                    }
                }},
                { "$map": {
                    "input": "$pros",
                    "as": "pro",
                    "in": {
                        "type": { "$literal": "pro" },
                        "value": "$$pro"
                    }
                }}
            ]
        }
    }},
    { "$unwind": "$data" },
    { "$group": {
        "_id": {
            "company": "$company",
            "model": "$model",
            "tag": "$data.value"
        },
        "pros": {
            "$sum": {
                "$cond": [
                    { "$eq": [ "$data.type", "pro" ] },
                    1,
                    0
                ]
            }
        },
        "cons": {
            "$sum": {
                "$cond": [
                    { "$eq": [ "$data.type", "con" ] },
                    1,
                    0
                ]
            }
        }
    }}
])

从您的样本中产生

{
    "_id" : {
            "company" : "Lenovo",
            "model" : "X200",
            "tag" : "Quality"
    },
    "pros" : 0,
    "cons" : 1
}
{
    "_id" : {
            "company" : "Lenovo",
            "model" : "X200",
            "tag" : "Value"
    },
    "pros" : 1,
    "cons" : 0
}
{
    "_id" : {
            "company" : "Lenovo",
            "model" : "X200",
            "tag" : "Styling"
    },
    "pros" : 1,
    "cons" : 0
}

这显然可以正确地在分组键中分配“专业”和“缺点”总计。

因此,“我看到”这里的值实际上并不是“相同”,而是实际上“不同”,因为匹配给每个字段累加器的不同条件。

因此,根据您的original question

进一步采取行动
db.collection.aggregate([
    { "$project": {
        "company": 1,
        "model": 1,
        "data": {
            "$setUnion": [
                { "$map": {
                    "input": "$cons",
                    "as": "con",
                    "in": {
                        "type": { "$literal": "con" },
                        "value": "$$con"
                    }
                }},
                { "$map": {
                    "input": "$pros",
                    "as": "pro",
                    "in": {
                        "type": { "$literal": "pro" },
                        "value": "$$pro"
                    }
                }}
            ]
        }
    }},
    { "$unwind": "$data" },
    { "$group": {
        "_id": {
            "company": "$company",
            "model": "$model",
            "tag": "$data.value"
        },
        "pros": {
            "$sum": {
                "$cond": [
                    { "$eq": [ "$data.type", "pro" ] },
                    1,
                    0
                ]
            }
        },
        "cons": {
            "$sum": {
                "$cond": [
                    { "$eq": [ "$data.type", "con" ] },
                    1,
                    0
                ]
            }
        }
    }},
    { "$group": {
        "_id": {
            "company": "$_id.company",
            "model": "$_id.model"
        },
        "data": { "$push": {
            "tag": "$_id.tag",
            "pros": "$pros",
            "cons": "$cons"
        }}
    }}
])

产地:

{
    "_id" : {
            "company" : "Lenovo",
            "model" : "X200"
    },
    "data" : [
            {
                    "tag" : "Quality",
                    "pros" : 0,
                    "cons" : 1
            },
            {
                    "tag" : "Value",
                    "pros" : 1,
                    "cons" : 0
            },
            {
                    "tag" : "Styling",
                    "pros" : 1,
                    "cons" : 0
            }
    ]
}

这正是你所要求的。