MongoDB:最小属性匹配

时间:2012-11-28 06:26:24

标签: mongodb

我有一个像这两个二进制字符串10110和01111

的MongoDB集合
 { element_id:a, field_1:1, field_2:0, field_3:1, field_4:1, field_5:0} #binary string: 10110
 { element_id:b, field_1:0, field_2:1, field_3:1, field_4:1, field_5:1} #binary string: 01111

我想在MongoDB中查询候选二进制字符串“11111”,但我的最小匹配(AND)值是4 (不是全部5)。这意味着从DB中选择该文档只需要四个匹配的一个位置。

所以预期的输出是 - element_id:b

我在MongoDB网站或Google上找不到任何内容。有人可以帮忙吗?

3 个答案:

答案 0 :(得分:2)

根据Chien-Wei先前的回答,

MapReduce是一个很好的方法。在MongoDB 2.2中,您还可以考虑使用Aggregation Framework

例如,如果您始终匹配11111,那么您可以$add感兴趣的字段的值,然后只有$match那些至少有4的字段:

db.element.aggregate(
    // Could use an initial $match here to find candidate documents (using indexed query)

    // Use $project to add calculated total
    { $project: {
        _id: 0,
        element_id: 1,
        // Assume we are matching 11111 and field values are always 0 or 1
        total: { $add: [ "$field_1", "$field_2", "$field_3", "$field_4", "$field_5" ] }
    }},

    // Filter to interesting results (at least 4 fields with '1')
    { $match: {
        total : { $gte : 4 }
    }}
)

示例输出:

{ "result" : [ { "element_id" : "b", "total" : 4 } ], "ok" : 1 }

如果您想要更通用的比较,可以使用$cond有条件地匹配目标数组,例如:

var targetArray = [1,1,1,1,1];
db.element.aggregate(
    // Could use an initial $match here to find candidate documents (using indexed query)

    // Use $project to add calculated total
    { $project: {
        _id: 0,
        element_id: 1,
        total: { $add: [
            { $cond:[{$eq:["$field_1", targetArray[0]]}, 1, 0 ]},
            { $cond:[{$eq:["$field_2", targetArray[1]]}, 1, 0 ]},
            { $cond:[{$eq:["$field_3", targetArray[2]]}, 1, 0 ]},
            { $cond:[{$eq:["$field_4", targetArray[3]]}, 1, 0 ]},
            { $cond:[{$eq:["$field_5", targetArray[4]]}, 1, 0 ]}
        ]}
    }},

    // Filter to interesting results (at least 4 fields with a match)
    { $match: {
        total : { $gte : 4 }
    }}
)

有关聚合选项和当前限制的一般比较,请参阅相关的StackOverflow问题:MongoDB aggregation comparison: group(), $group and MapReduce

答案 1 :(得分:1)

这是我的方法,虽然有点难看......

我使用map / reduce:(f是你的输入,你必须在函数中设置数组)

m = function() { 
    c=0; 
    f = [1,1,1,1,1]; 
    if(f[0]==this.field_1){c++;} 
    if(f[1]==this.field_2){c++;} 
    if(f[2]==this.field_3){c++;} 
    if(f[3]==this.field_4){c++;} 
    if(f[4]==this.field_5){c++;} 
    if(c>=4){
        emit(this.element_id, c)
    }
};

r = function(key, values) { return {key:values}; };

db.test.mapReduce(m, r, {out:{inline:1}})['results']

结果:

[ { "_id" : "b", "value" : 4 } ]

答案 2 :(得分:1)

您可以使用$or修饰符以编程方式构建复杂查询,以匹配所请求元素的所有可能组合:

buildQuery = function(arr){
  var N, i, j, query, subquery;
  N = arr.length;
  query = {$or: []};
  for (i = 1; i <= N; ++i) {
    subquery = {};
    for (j = 1; j <= N; ++j) {
      if (i === j) continue;
      subquery['field_' + j] = arr[j-1];
    }
    query.$or.push(subquery);
  }
  return query;
}

query = buildQuery([1,1,1,1,1]);
db.collection.find(query)

buildQuery输出如下所示:

{ '$or': 
   [ { field_2: 1, field_3: 1, field_4: 1, field_5: 1 },
     { field_1: 1, field_3: 1, field_4: 1, field_5: 1 },
     { field_1: 1, field_2: 1, field_4: 1, field_5: 1 },
     { field_1: 1, field_2: 1, field_3: 1, field_5: 1 },
     { field_1: 1, field_2: 1, field_3: 1, field_4: 1 } ] }