我想对我的文档进行分组,并且对于某些字段,使用最新时间戳(即最近插入/更新的值)获取记录的值。在下面的示例中,我想按用户ID和电话进行分组,并使用该组中最新时间戳的记录电子邮件。我的初始策略是按降序时间戳排序,并为聚合获取第一个值,如下所示:
import pymongo
...
pipeline = [
{
"$sort": {"timestamp": -1 }
},
{ "$group": {
"_id": {
"userId": "$userId",
"userPhone": "$userPhone",
"userEmail": { "$first" : "$userEmail"},
"count": {"$sum": 1}
}
}
]
但是我遇到了以下错误:
pymongo.errors.OperationFailure: Unrecognized expression '$first'
是否有可用于pymongo的等效$ first函数?
答案 0 :(得分:1)
您的管道语法不正确。蓄能器在他们自己的领域。
像
这样的东西pipeline = [
{ "$sort": {"timestamp": -1 } },
{ "$group": { "_id": { "userId": "$userId", "userPhone": "$userPhone" }, "userEmail": { "$first" : "$userEmail"}, "count": {"$sum": 1} } }
]