我意外地导入了一些文件,这些文件现在有重复的“slu”“。
我正在使用mongoid
,所以我的模型看起来像这样:
类MyModel field:name,String#“My Object name” field:slugs,Array#[“my-object-name”] 端
slugs包含一串字符串。但有些是重复的,不应该是。
如何构建查询以在数组中搜索重复项?
这是我的实际方法,但其结果包含我的所有条目,这不是真的
results = MyModel.unscoped.collection.aggregate([
{"$match" => {"count" => {"$gt" => 1}}},
{'$group' => {"_id" => "$slugs",
"count" => {"$sum" => 1}}}])
有人可以建议我查询吗?
答案 0 :(得分:0)
您可以尝试以下聚合。
您需要在$match
阶段后$group
和$unwind
slugs
在每个slug元素上应用分组。
MyModel.unscoped.collection.aggregate([
{$unwind => "$slugs"},
{$group => {_id => "$slugs",
count => {"$sum" => 1}}},
{$match => {count => {"$gt" => 1}}}
])
这将为您提供整个集合中所有重复的slug元素。
答案 1 :(得分:0)
我的确切查询如下所示:
results = MyModel.unscoped.collection.aggregate(
[{"$group" =>
{_id: {"_slugs" => "$_slugs"},
recordIds: {"$addToSet" => "$_id"},
count: {"$sum" => 1}
}
},
{"$match" => {count: {"$gt" => 1} } }
])