MongoDB聚合 - 匹配数组

时间:2015-05-29 19:10:22

标签: mongodb aggregation-framework

我有一个我正在进行聚合的集合,我基本上把它归结为

{array:[1,2,3], value: 1},
{array:[1,2,3], value: 4}

如何执行聚合匹配以检查值是否在数组中?我尝试使用{$match: {"array: {$in: ["$value"]}}},但没有找到任何内容。

我希望输出(如果使用上面的例子):

{array:[1,2,3], value:1}

9 个答案:

答案 0 :(得分:13)

如上所述,$where是一个很好的选择,您无需在聚合管道中继续逻辑。

但如果你这样做,那么使用$redact$map将“值”转换为数组并使用$setIsSubSet进行比较。这是最快的方法,因为您不需要使用$unwind复制文档:

db.collection.aggregate([
   { "$redact": {
       "$cond": {
           "if": { "$setIsSubset": [
                { "$map": {
                    "input": { "$literal": ["A"] },
                    "as": "a",
                    "in": "$value"
                }},
                "$array"
           ]},
           "then": "$$KEEP",
           "else": "$$PRUNE"
       }
   }}
])

$redact 管道运算符允许在$cond内处理逻辑条件,并使用特殊操作$$KEEP将文档“保留”在逻辑位置条件为真或$$PRUNE“删除”条件为假的文档。

这允许它像$project一样使用后续$match,但在单个管道阶段更有效。

考虑到这些是本机编码运算符而不是JavaScript,那么它可能是“最快”的匹配方式。因此,如果您使用的是MongoDB 2.6或更高版本,那么您应该采用这种方式来比较文档中的这些元素。

答案 1 :(得分:7)

根据@ chridam的答案略有不同:

db.test.aggregate([
    { "$unwind": "$array" },
    { "$group": {
                  _id: { "_id": "$_id", "value": "$value" },
                  array: { $push: "$array" },
                  mcount: { $sum: {$cond: [{$eq: ["$value","$array"]},1,0]}}
                }
    },
    { $match: {mcount: {$gt: 0}}},
    { "$project": { "value": "$_id.value", "array": 1, "_id": 0 }}
])

我们的想法是$unwind$group支持数组,在mcount中计算与该值匹配的项目数。之后,$match上的简单mcount > 0将过滤掉不需要的文档。

答案 2 :(得分:5)

更有效的方法是使用 $redact 运算符的单个管道,如下所示:

db.collection.aggregate([
    { 
        "$redact": {
            "$cond": [
                { 
                    "$setIsSubset": [ 
                        ["$value"],
                        "$array"  
                    ] 
                },
                "$$KEEP",
                "$$PRUNE"
            ]
        }
    }
])

对于不支持 $redact 的早期版本的MongoDB(版本< 2.6),请考虑使用 $unwind 的此聚合管道操作者:

db.collection.aggregate([
    { "$unwind": "$array" },
    {
        "$project": {
            "isInArray": {
                "$cond": [
                    { "$eq": [ "$array", "$value" ] },
                    1,
                    0
                ]
            },
            "value": 1,
            "array": 1
        }
    },
    { "$sort": { "isInArray": -1 } },
    {
        "$group": {
            "_id": {
                "_id": "$_id",
                "value": "$value"
            },
            "array": { "$push": "$array" },
            "isInArray": { "$first": "$isInArray" }
        }
    },
    { "$match": { "isInArray": 1 } },
    { "$project": { "value": "$_id.value", "array": 1, "_id": 0 } }
])

答案 3 :(得分:4)

您可以在3.6版本的常规查询中使用聚合表达式。

db.collection_name.find({"$expr": {"$in": ["$value", "$array"]}})

使用聚合:

您可以在当前$match + $expr版本中使用3.6

db.collection_name.aggregate({"$match": {"$expr": {"$in": ["$value", "$array"]}}})

您可以在$redact + $in版本中尝试3.4表达。

db.collection_name.aggregate({
  "$redact": {
    "$cond": [
      {
        "$in": [
          "$value",
          "$array"
        ]
      },
      "$$KEEP",
      "$$PRUNE"
    ]
  }
})

答案 4 :(得分:2)

如果汇总不是

,则可以使用$where
db.collection.find({ $where: function(){ 
    return (this.array.indexOf(this.value) !== -1)}
})

答案 5 :(得分:1)

尝试$ eq和$ setIntersection的组合

{$group :{
  _id: "$id",
  yourName :  { $sum:
  { $cond :[
       {$and : [
          {$eq:[{$setIntersection : ["$someArrayField", ["$value"]]  },["$value"]]}
         ]
      },1,0]
  }

} }

答案 6 :(得分:0)

我更喜欢不进行分组,因为从v.3.2开始就有一种简单的方法

...aggregate([
      {
        $addFields: {
          arrayFilter: {
            $filter: {
              input: '$array',
              as: 'item',
              cond: ['$$item', '$value']
            }
          }
        }
      },
      {
        $unwind: '$arrayFilter'
      },
      {
        $project: {
          arrayFilter: 0
        }
      }
    ]);
  1. 添加一个临时过滤器字段
  2. 在结果数组上展开$ unwind(删除具有空数组的管道结果)
  3. (可选)通过项目从结果中删除过滤器字段

答案 7 :(得分:0)

您可以使用简单的$ project&$ match

db.test.aggregate([{
$project: {
              arrayValue: 1,
              value: 1,
              "has_same_value" : { $in: ["$value", "$arrayValue"] }
          }
},
{
   $match: {has_same_value: true}
},
{
  $project: {has_same_value: 0}
}])

答案 8 :(得分:-1)

      "$match": { "name": { "$in":["Rio","Raja"] }} }])