以下是我的mongodb集合中的一些示例条目:
{ name: "Tom", timestamp: "Jun 4" },
{ name: "Jerry", timestamp: "Jun 4" },
{ name: "Tom", timestamp: "Jun 2" },
{ name: "Tom", timestamp: "May 25" },
{ name: "Jerry", timestamp: "May 21" },
{ name: "Robin", timestamp: "May 19" }
每次用户登录我的应用程序时,我都会为该用户创建一个条目。
问题:我需要找出过去5天未登录我的应用的用户列表。也就是说, 5月30日之后没有条目。今天是 6月4日。
答案: 罗宾
尝试1:
[
{ "$match": { "timestamp": { "$lt": FIVE_DAYS_AGO } } },
{ "$sort": { "timestamp": 1 } },
{ "$group": { "_name": "$name", "lastSynced": { "$last": "$timestamp" } }
]
给出不正确的结果,因为在NOW和FIVE_DAYS_AGO之间可能存在未考虑的条目。
尝试2:
[
{ "$sort": { "timestamp": 1 } },
{ "$group": { "_name": "$name", "lastSynced": { "$last": "$timestamp" } }
]
未优化!因为它返回所有不同的用户条目。然后,我必须遍历结果并过滤掉时间戳为FIVE_DAYS_AGO的条目。
如何构造查询以获取最近X天没有条目的用户列表?
答案 0 :(得分:0)
需要注意的几点:
请考虑我的评论。
由于
timestamp
是字符串格式,因此需要使用$dateFromString
运算符,如果您查看文档,则只有有限的日期字符串可以转换。因此,建议您将字段更新为适当的可转换值。
您的$group
不正确。它期望_id
字段,否则将引发以下错误:
The field '_name' must be an accumulator object.
timestamp
中需要年份值,但出现此错误:(ConversionFailure) Error parsing date string
考虑到以上几点,如果您的收藏如下:
[
{
name: "Tom",
timestamp: "06 04 2020"
},
{
name: "Jerry",
timestamp: "06 04 2020"
},
{
name: "Tom",
timestamp: "06 02 2020"
},
{
name: "Tom",
timestamp: "05 25 2020"
},
{
name: "Jerry",
timestamp: "05 21 2020"
},
{
name: "Robin",
timestamp: "05 19 2020"
}
]
然后在下面的PyMongo查询中会有所帮助:
from datetime import datetime
five_days_ago = datetime(2020, 5, 30)
db.test12.aggregate([
{
'$group': {
'_id': '$name',
'timestap_list': {
'$push': {
'$dateFromString': {
'dateString': '$timestamp',
'format': '%m %d %Y'
}
}
}
}
},
{
'$project': {
'timestamp': {
'$allElementsTrue': {
'$map': {
'input': '$timestap_list',
'as': 't',
'in': {
'$lte': [
'$$t',
five_days_ago
]
}
}
}
}
}
},
{
'$match': {
'timestamp': True
}
},
{
'$project': {
'timestamp': 0
}
}
])
输出:
{
'_id': 'Robin'
}