考虑下面的mongo集合示例:
{"_id" : ObjectId("4f304818884672067f000001"), "hash" : {"call_id" : "1234"}, "something" : "AAA"}
{"_id" : ObjectId("4f304818884672067f000002"), "hash" : {"call_id" : "1234"}, "something" : "BBB"}
{"_id" : ObjectId("4f304818884672067f000003"), "hash" : {"call_id" : "1234"}, "something" : "CCC"}
{"_id" : ObjectId("4f304818884672067f000004"), "hash" : {"call_id" : "5555"}, "something" : "DDD"}
{"_id" : ObjectId("4f304818884672067f000005"), "hash" : {"call_id" : "5555"}, "something" : "CCC"}
我想查询这个集合,只获取每个“call_id”的第一个条目,换句话说,我试图获得基于“call_id”的唯一结果。 我尝试使用.distinct方法:
@result = Myobject.all.distinct('hash.call_id')
但结果数组将只包含唯一的call_id字段:
["1234", "5555"]
我也需要所有其他领域。 是否可以像这样进行查询?:
@result = Myobject.where('hash.call_id' => Myobject.all.distinct('hash.call_id'))
由于
答案 0 :(得分:7)
您不能简单地使用distinct返回文档(或子集)。根据{{3}},它只返回基于给定键的不同值数组。但是你可以通过使用map-reduce
来实现这一点var _map = function () {
emit(this.hash.call_id, {doc:this});
}
var _reduce = function (key, values) {
var ret = {doc:[]};
var doc = {};
values.forEach(function (value) {
if (!doc[value.doc.hash.call_id]) {
ret.doc.push(value.doc);
doc[value.doc.hash.call_id] = true; //make the doc seen, so it will be picked only once
}
});
return ret;
}
上面的代码是自解释的,我在地图函数上按键hash.call_id
对其进行分组并返回整个文档,以便可以通过reduce函数进行处理。
在缩小功能上,只需遍历分组结果集,并从分组集中选择一个项目(在多个重复键值中 - 不同的模拟)。
最后创建一些测试数据
> db.disTest.insert({hash:{call_id:"1234"},something:"AAA"})
> db.disTest.insert({hash:{call_id:"1234"},something:"BBB"})
> db.disTest.insert({hash:{call_id:"1234"},something:"CCC"})
> db.disTest.insert({hash:{call_id:"5555"},something:"DDD"})
> db.disTest.insert({hash:{call_id:"5555"},something:"EEE"})
> db.disTest.find()
{ "_id" : ObjectId("4f30a27c4d203c27d8f4c584"), "hash" : { "call_id" : "1234" }, "something" : "AAA" }
{ "_id" : ObjectId("4f30a2844d203c27d8f4c585"), "hash" : { "call_id" : "1234" }, "something" : "BBB" }
{ "_id" : ObjectId("4f30a2894d203c27d8f4c586"), "hash" : { "call_id" : "1234" }, "something" : "CCC" }
{ "_id" : ObjectId("4f30a2944d203c27d8f4c587"), "hash" : { "call_id" : "5555" }, "something" : "DDD" }
{ "_id" : ObjectId("4f30a2994d203c27d8f4c588"), "hash" : { "call_id" : "5555" }, "something" : "EEE" }
并运行此地图缩小
> db.disTest.mapReduce(_map,_reduce, {out: { inline : 1}})
{
"results" : [
{
"_id" : "1234",
"value" : {
"doc" : [
{
"_id" : ObjectId("4f30a27c4d203c27d8f4c584"),
"hash" : {
"call_id" : "1234"
},
"something" : "AAA"
}
]
}
},
{
"_id" : "5555",
"value" : {
"doc" : [
{
"_id" : ObjectId("4f30a2944d203c27d8f4c587"),
"hash" : {
"call_id" : "5555"
},
"something" : "DDD"
}
]
}
}
],
"timeMillis" : 2,
"counts" : {
"input" : 5,
"emit" : 5,
"reduce" : 2,
"output" : 2
},
"ok" : 1,
}
您获得了不同集合的第一个文档。您可以通过首先对map / reduce函数进行字符串化并像这样调用mapreduce来实现mongoid中的相同操作
MyObject.collection.mapreduce(_map,_reduce,{:out => {:inline => 1},:raw=>true })
希望有所帮助