如何通过调整嵌套对象数组来检索文档?

时间:2015-08-22 11:07:28

标签: javascript mongodb mongodb-query aggregation-framework

存储在mongodb中的对象的结构如下:

obj = {_id: "55c898787c2ab821e23e4661", ingredients: [{name: "ingredient1", value: "70.2"}, {name: "ingredient2", value: "34"}, {name: "ingredient3", value: "15.2"}, ...]}

我想要检索的是所有文件,特定成分的值大于任意数字。

更具体地说,假设我们要检索所有包含名称为" ingredient1"它的值大于50。

尝试以下操作我无法检索到所需的结果:

var collection = db.get('docs');
var queryTest = collection.find({$where: 'this.ingredients.name == "ingredient1" && parseFloat(this.ingredients.value) > 50'}, function(e, docs) {
                                    console.log(docs);
                                });

有谁知道对特定数组元素名称和值进行条件化的正确查询是什么?

谢谢!

2 个答案:

答案 0 :(得分:1)

这里你真的不需要https://www.startssl.com/的JavaScript评估,只需使用带有$where查询的基本查询运算符。虽然这里的“值”元素实际上是字符串,但这并不是真正的重点(正如我在本文末尾所解释的那样)。重点是第一次做对:

collection.find(
    {
        "ingredients": {
            "$elemMatch": {
                "name": "ingredient1",
                "value": { "$gt": 50 }
            }
         }
    },
    { "ingredients.$": 1 }
)

第二部分中的$$elemMatch,它只从查询条件中投射数组的匹配元素。

这也比JavaScript评估快得多,因为评估代码不需要编译并使用本机编码运算符,以及“索引”可用于“名称”甚至“ value“数组元素,以帮助过滤匹配。

如果您希望数组中有多个匹配项,那么postional operator命令是最佳选择。使用现代MongoDB版本,这非常简单:

collection.aggregate([
    { "$match": {
        "ingredients": {
            "$elemMatch": {
                "name": "ingredient1",
                "value": { "$gt": 50 }
            }
         }
    }},
    { "$redact": {
        "$cond": {
            "if": { 
               "$and": [
                   { "$eq": [ { "$ifNull": [ "$name", "ingredient1" ] }, "ingredient1" ] },
                   { "$gt": [ { "$ifNull": [ "$value", 60 ] }, 50 ] }
               ]
            },
            "then": "$$DESCEND",
            "else": "$$PRUNE"
        }
    }}
])

在即将发布的$filter运算符版本中更简单:

collection.aggregate([
    { "$match": {
        "ingredients": {
            "$elemMatch": {
                "name": "ingredient1",
                "value": { "$gt": 50 }
            }
         }
    }},
    { "$project": {
        "ingredients": {
            "$filter": {
                "input": "$ingredients",
                "as": "ingredient",
                "cond": {
                    "$and": [
                        { "$eq": [ "$$ingredient.name", "ingredient1" ] },
                        { "$gt": [ "$$ingredient.value", 50 ] }
                    ]
                }
            }
        }
    }}
])

在两种情况下,您都有效地“过滤”了与初始文档匹配后的条件不匹配的数组元素。

此外,由于您的“值”现在实际上是“字符串”,因此您应该将其更改为数字。这是一个基本过程:

var bulk = collection.initializeOrderedBulkOp(),
    count = 0;

collection.find().forEach(function(doc) {
    doc.ingredients.forEach(function(ingredient,idx) {
        var update = { "$set": {} };
        update["$set"]["ingredients." + idx + ".value"] = parseFloat(ingredients.value);
        bulk.find({ "_id": doc._id }).updateOne(update);
        count++;

        if ( count % 1000 != 0 ) {
            bulk.execute();
            bulk = collection.initializeOrderedBulkOp();
        }
    })
]);

if ( count % 1000 != 0 )
    bulk.execute();

这将修复数据,以便查询在此形成。

这比使用JavaScript $where处理要好得多,后者需要评估集合中的每个文档而不需要过滤索引。正确的形式是:

collection.find(function() {
    return this.ingredients.some(function(ingredient) { 
        return ( 
           ( ingredient.name === "ingredient1" ) && 
           ( parseFloat(ingredient.value) > 50 ) 
        );
    });
})

这也不能像其他形式一样“投射”结果中的匹配值。

答案 1 :(得分:0)

尝试使用$ elemMatch:

var queryTest = collection.find(
   { ingredients: { $elemMatch: { name: "ingredient1", value: { $gte: 50 } } } }
);