我有以下文件:
{
_id : 21353456,
username : "xy",
text : "asdf",
comments : [
{
username : "User1",
text : "hi",
},
{
username : "User2",
text : "hi1",
},
{
username : "User3",
text : "hi2",
},
{
username : "User4",
text : "hi3",
}
]
}
现在我想通过聚合和项目获取用户名,文本和注释。此外,如果comments数组包含带有“User1”的用户名,我还需要一个布尔值。我有这个,但它不起作用。
db.posttest.aggregate(
[
{
$project:
{
username: 1,
text: 1,
comments : 1,
hasComment: { $eq: [ "comments.$.username", "User1" ] },
_id: 0
}
}
]
)
答案 0 :(得分:5)
要实现此目的,您需要首先unwind
注释,然后使用group
进行一些小技巧。如果你想省略_id
,那么你还需要做一个简单的项目。这是完整的聚合管道:
db.posttest.aggregate([
{ $unwind : "$comments" },
{ $group : {
_id : "$_id",
username : { $first : "$username" },
text : { $first : "$text" },
comments : { $push : "$comments" },
hasComments : { $max : { $eq : [ "$comments.username", "User1" ] } }
}},
{ $project : { _id : false } }
])
以下是解释。
首先,我们需要摆脱一个数组(comments
)。要做到这一点,我们将取消记录;它给了我们四个记录:
{
"_id" : 21353456,
"username" : "xy",
"text" : "asdf",
"comments" : {
"username" : "User1",
"text" : "hi"
}
},
{
"_id" : 21353456,
"username" : "xy",
"text" : "asdf",
"comments" : {
"username" : "User2",
"text" : "hi1"
}
},
{
"_id" : 21353456,
"username" : "xy",
"text" : "asdf",
"comments" : {
"username" : "User3",
"text" : "hi2"
}
},
{
"_id" : 21353456,
"username" : "xy",
"text" : "asdf",
"comments" : {
"username" : "User4",
"text" : "hi3"
}
}
现在我们可以将所有记录分组为一个将函数应用于每个字段的记录。首先,我们需要给出标准,“分组依据”字段(或字段集)。在我们的例子中,它只是id:_id: "$_id"
。
然后,对于每个字段,我们需要决定如何将其包含在结果记录中。我们的字段很少:username
,text
和comments
。对于每四个记录,用户名和文本是相同的,因此我们可以轻松选择其中任何一个,即$first
或$last
。
comments
是不同的。我们希望保留所有这些内容,以便我们每个$push
回来。
hasComments
在这里有点棘手:我们需要检查至少有一个comment.username
是否包含用户名。我们可以在这里使用$eq: [...]
,它会给我们一些数组,例如[true, false, false, false]
或[false, false, true, false]
。我们需要选择哪个值进入结果记录。在这种情况下,我们既不能使用$first
也不能使用$last
。但是,$max
会给我们一个合适的结果。