MongoDB聚合。检查嵌套数组是否包含值

时间:2014-11-26 16:15:49

标签: mongodb spring-data-mongodb

我在实体中有这样的字段:

private String userId;
private String username;
private Date created;
private List<Comment> comments = new ArrayList<>();

Comment有以下字段:

private String userId;
private String username;
private String message;
private Date created;

我需要进行聚合,并收到类似的内容:

{
  "userId" : "%some_userId%",
  "date" : "%some_date%",
  "commentsQty" : 100,
  "isCommented" : true
}

我的聚合看起来像这样:

{ "aggregate" : "%entityName%" , "pipeline" : [
   { "$project" : { 
              "username" : 1 , 
              "userId" : 1 , 
              "created" : 1 , 
              "commentQty" : { "$size" : [ "$comments"]}}}]}

它工作正常。但我还需要检查,IF注释数组包含一些注释,具体的userId。我尝试了这个,但它无法执行:

{ "aggregate" : "%entityName%" , "pipeline" : [
   { "$project" : { 
              "username" : 1 , 
              "userId" : 1 ,
              "created" : 1 , 
              "commentQty" : { "$size" : [ "$comments"]} ,
              "isCommented" : { "$exists" : [ "$comments.userId" , "5475b1e45409e07b0da09235"]}}}]}

有这样的消息:Command execution failed: Error [exception: invalid operator '$exists']

如何进行此类检查?

UPD:还尝试过运营商$in和类似的,但它们对于排队有效,而不是聚合。

2 个答案:

答案 0 :(得分:5)

  带有此类消息的

:命令执行失败:错误[例外:无效的运算符&#39; $存在&#39;]

目前aggregation管道中没有$exists运算符。

修改

写出更好的答案:

您可以通过以下方式检查是否有用户发表了评论:

  • 使用$setIntersection运算符来获取我们正在寻找的userId数组,如果用户确实对该帖子发表了评论。
  • 应用$size运算符来获取结果数组的大小。
  • 使用$gt运算符检查大小是否大于0
  • 如果是,则表示我们正在寻找的userId存在一条或多条评论,否则不会。

示例代码:

var userIdToQuery = "2";
var userIdsToMatchAgainstComments = [ObjectId("5475b1e45409e07b0da09235")];

db.t.aggregate([
{$match:{"userId":userIdToQuery}},
{$project:{"userName":1,
           "created":1,
           "commentQty":{$size:"$comments"},
           "isCommented":{$cond:
                          [{$gt:[
                           {$size:
                             {$setIntersection:["$comments.userId",
                                     userIdsToMatchAgainstComments]}}
                          ,0]},
                          true,false]}}}
])

上一个回答:

  • Unwind评论。
  • Project额外字段isCommented对于每个评论文档, 检查它是否有我们正在搜索的userId,如果有的话 相应的userId,然后将变量设置为1其他0
  • Group再次合并文件,将isCommented中的值相加,如果 它是> 0,具有用户ID的文档存在于其他组中 不
  • Project相应字段。

守则:

{ "aggregate" : "%entityName%" , "pipeline" :[
    {$unwind:"$comments"},
    {$project:{
               "username":1,
               "userId":1,
               "created":1,
               "comments":1,
               "isCommented":{$cond:[{$eq:["$comments.userId",
                                           ObjectId("5475b1e45409e07b0da09235")
                                          ]
                                     },
                                     1,
                                     0]}}},
    {$group:{"_id":{"_id":"$_id",
                    "username":"$username",
                    "userId":"$userId",
                    "created":"$created"},
             "isCommented":{$sum:"$isCommented"},
             "commentsArr":{$push:"$comments"}}},
    {$project:{"comments":"$commentsArr",
               "_id":0,
               "username":"$_id.username",
               "userId":"$_id.userId",
               "created":"$_id.userId",
               "isCommented":{$cond:[{$eq:["$isCommented",0]},
                                  false,
                                  true]},
               "commentQty":{$size:"$commentsArr"}}},
    ]}

答案 1 :(得分:2)

如果您想检查确切的单个值(即特定登录的 userId ),只需使用$in运算符:

let loggedInUserId = "user1";

db.entities.aggregate([
{$project:{
    "userName": 1,
    "isCommentedByLoggedInUser": {
        $in : [ loggedInUserId, "$comments.userId" ]
    },
])

那就是它。

注意:如果您不希望每个文档都包含 comments 数组,请使用$ifNull运算符包装它,并生成一个空数组:

$in : [ loggedInUserId, { "$ifNull": [ "$comments.userId", [] ] } ]

当您需要至少一个用户(任何逻辑)中的一个来满足要求时,BatScream的答案就是检查多个值。正如我所看到的那样,你的情况不是必需的,但这是一种很好的方式。

因此,BatScream以聚合方式提到任何逻辑,并且我将以聚合方式继续使用所有逻辑。用于查找具有所有特定用户的文档&#39;评论,只需使用$setIsSubset运算符:

let manyUsersIdsThatWeWantAll = ["user1", "user2", "user3"];

db.entities.aggregate([
{$project:{
    "userName": 1,
    "isCommentedByAllThoseUsers": {
        $setIsSubset: [
            manyUsersIdsThatWeWantAll, // the needle set MUST be the first expression
            "$comments.userId"
        ]
    },
])