使用以下PyMongo查询。我使用了Mongo网络研讨会的一些提示,他们建议使用_id字段来存储时间戳,以提高性能和内存使用率。
cursor = db.dados_meteo_reloaded.aggregate( [
{
"$match": {
"_id": {
"$gte": "0001:20120901",
"$lte": "0001:20140215"
},
"TMP": {
"$lt": 7.2
}
}
},
{
"$project": {
"year": {
"$substr": [
"$_id",
5,
4
]
},
"month": {
"$substr": [
"$_id",
9,
2
]
},
"day": {
"$substr": [
"$_id",
11,
2
]
}
}
},
{
"$group": {
"_id": {"year":"$year","month":"$month","day":"$day"},
"frio": {
"$sum": 0.25
}
}
},
{"$sort":{"_id.year":1, "_id.month":1, "_id.day":1}}
])
我得到的结果只按天排序。在管道的$ sort步骤中,我只使用
{"$sort":{"_id.year":1, "_id.month":1}
结果按年份和月份正确排序。 $ sort步骤可以使用多少字段?
以下是一些示例文档
{
"_id" : "0001:20121201000000",
"RNF" : 0,
"WET" : 8,
"HMD" : 100,
"TMP" : 4.4
},
{
"_id" : "0001:20121201001500",
"RNF" : 0,
"WET" : 7.9,
"HMD" : 100,
"TMP" : 4.2
}
答案 0 :(得分:5)
引用文档:
$sort
阶段具有以下原型形式:
{ $sort: { <field1>: <sort order>, <field2>: <sort order> ... } }
因此$sort
阶段可以使用的字段数没有限制。
但是有内存restrictions :
$sort
阶段的RAM限制为100兆字节。默认情况下,如果阶段超出此限制,$ sort将产生错误。要允许处理大型数据集,请将allowDiskUse
选项设置为 true 以启用$sort
操作以写入临时文件。
在Pymongo
中,使用allowDiskUse
选项的语法是:
collection.aggregate(
[
{ '$sort': { <field1>: <sort order>, <field2>: <sort order> ... } }
],
allowDiskUse = True
)
答案 1 :(得分:1)
排序没有限制。Mongo Documentation
{ $sort: { <field1>: <sort order>, <field2>: <sort order> ... } }
答案 2 :(得分:1)
我找到了一个可能的解决方案here。我已经测试了它。