MongoDB:查找具有给定子文档数组的文档

时间:2015-06-17 07:51:48

标签: mongodb aggregation-framework

我想找到包含给定子文档的文档,假设我的commits集合中有以下文档:

// Document 1
{ 
  "commit": 1,
  "authors" : [
    {"name" : "Joe", "lastname" : "Doe"},
    {"name" : "Joe", "lastname" : "Doe"}
  ] 
}

// Document 2
{ 
  "commit": 2,
  "authors" : [
    {"name" : "Joe", "lastname" : "Doe"},
    {"name" : "John", "lastname" : "Smith"}
  ] 
}

// Document 3
{ 
  "commit": 3,
  "authors" : [
    {"name" : "Joe", "lastname" : "Doe"}
  ] 
}

我想从上面的集合中获得的只是第一个文档,因为我知道我正在寻找一个commit,其中包含authors namelastname 。所以我提出了查询: db.commits.find({ $and: [{'authors': {$elemMatch: {'name': 'Joe, 'lastname': 'Doe'}}, {'authors': {$elemMatch: {'name': 'Joe, 'lastname': 'Doe'}}], 'authors': { $size: 2 } })

$size用于过滤掉第三个文档,但查询仍返回第二个文档,因为$elemMatch都返回True。

我不能在子文档上使用索引,因为用于搜索的作者的顺序是随机的。有没有办法在不使用Mongo的聚合函数的情况下从结果中删除第二个文档?

1 个答案:

答案 0 :(得分:2)

您要求的内容与标准查询略有不同。实际上,您要求在数组两次次或更多次中找到“name”和“lastname”的位置以识别该文档。

标准查询参数与结果中数组元素匹配的“次数”不匹配。但是,当然您可以要求服务器使用aggregation framework

为您“计算”
db.collection.aggregate([
    // Match possible documents to reduce the pipeline
    { "$match": {
        "authors": { "$elemMatch": { "name": "Joe", "lastname": "Doe" } }
    }},

    // Unwind the array elements for processing
    { "$unwind": "$authors" },

    // Group back and "count" the matching elements
    { "$group": {
        "_id": "$_id",
        "commit": { "$first": "$commit" },
        "authors": { "$push": "$authors" },
        "count": { "$sum": {
            "$cond": [
                { "$and": [
                    { "$eq": [ "$authors.name", "Joe" ] },
                    { "$eq": [ "$authors.lastname", "Doe" ] }
                ]},
                1,
                0
            ]
        }}
    }},

    // Filter out anything that didn't match at least twice
    { "$match": { "count": { "$gte": 2 } } }
])

基本上你是你的条件,但要在$cond运算符内匹配,匹配1匹配,0不匹配,并将其传递给$sum以获得该文件的总数。

然后过滤掉任何不匹配2次或更多次的文件