样品采集:
#0
{ '_id' : ObjectId("5291c70419181fe0f8ea9ff8"),
'state' : 'CA',
'hitCount' : 100
}
#1
{ '_id' : ObjectId("5d3443fdf4441fe0f8ea9kk2"),
'state' : 'CA',
'hitCount' : 10
}
#2
{ '_id' : ObjectId("52943242344fe0f8ea9ff348"),
'state' : 'CA',
'hitCount' : 1
}
#3
{ '_id' : ObjectId("5291c7er89482942342344a"),
'state' : 'NY',
'hitCount' : 100
}
#4
{ '_id' : ObjectId("342834723942sdfsafa334"),
'state' : 'NY',
'hitCount' : 10
}
#5
{ '_id' : ObjectId("ewr8943459n0ads1231411"),
'state' : 'NY',
'hitCount' : 1
}
我如何退回文件0,1,3& 4 - 按州分组并返回前2个hitCount。
我一直在尝试使用聚合组功能。我想我已经接近但我的解决方案仍然使用了很多客户端工作 - 我带来了所有文件,然后得到了我需要的文件。这肯定不会扩展,所以需要一些帮助来解决它。
我正在使用pymongo。