在数组中查找重复的条目

时间:2017-03-03 10:22:07

标签: mongodb mongodb-query mongoid aggregation-framework

我意外地导入了一些文件,这些文件现在有重复的“slu”“。

我正在使用mongoid,所以我的模型看起来像这样:

类MyModel   field:name,String#“My Object name”   field:slugs,Array#[“my-object-name”] 端

slugs包含一串字符串。但有些是重复的,不应该是。

如何构建查询以在数组中搜索重复项?

这是我的实际方法,但其结果包含我的所有条目,这不是真的

    results = MyModel.unscoped.collection.aggregate([
       {"$match" => {"count" => {"$gt" => 1}}},
       {'$group' => {"_id" => "$slugs", 
                     "count" => {"$sum" => 1}}}])

有人可以建议我查询吗?

2 个答案:

答案 0 :(得分:0)

您可以尝试以下聚合。

您需要在$match阶段后$group$unwind slugs在每个slug元素上应用分组。

MyModel.unscoped.collection.aggregate([
       {$unwind => "$slugs"}, 
       {$group => {_id => "$slugs",
            count => {"$sum" => 1}}}, 
       {$match => {count => {"$gt" => 1}}}
])

这将为您提供整个集合中所有重复的slug元素。

答案 1 :(得分:0)

我的确切查询如下所示:

results = MyModel.unscoped.collection.aggregate(
         [{"$group" => 
                   {_id: {"_slugs" => "$_slugs"},
                    recordIds: {"$addToSet" => "$_id"}, 
                    count: {"$sum" => 1}
                   }
            },
          {"$match" => {count: {"$gt" => 1} } } 
          ])