我尝试通过3M表找到所有具有相同用户名的用户。我读到这样的东西可能会成功。
User.find(:all, :group => [:username], :having => "count(*) > 1" )
然而,因为我使用的是Postgres,所以请回复ActiveRecord::StatementInvalid: PG::Error: ERROR: column "users.id" must appear in the GROUP BY clause or be used in an aggregate function
。
我正在尝试这样的事情
User.select('users.id, users.username').having("count(*) > 1").group('users.username')
但仍然得到同样的错误。知道我做错了吗?
更新:我使用User.select('users.*').group('users.id').having('count(users.username) > 1')
以某种方式工作了但是这个查询返回了我看起来像一个空数组,即使它创建了5条记录。
GroupAggregate (cost=9781143.40..9843673.60 rows=3126510 width=1365)
Filter: (count(username) > 1)
-> Sort (cost=9781143.40..9788959.68 rows=3126510 width=1365)
Sort Key: id
-> Seq Scan on users (cost=0.00..146751.10 rows=3126510 width=1365)
(5 rows)
=> []
知道为什么会这样,以及如何获得这5行?
答案 0 :(得分:5)
我认为你能得到的最好的方法是获取重复记录的用户名。这可以通过
来实现User.select(:username).group(:username).having('COUNT(username) > 1')
答案 1 :(得分:0)
数据库中的“group by”将每个组折叠为输出中的一行。您最有可能通过以下查询生成您想要的内容:
User.where("name in (select name from users group by name having count(*)>1)").order(:name)
上面的内部查询查找出现多次的所有名称。然后我们找到具有这些名称的所有行。按名称排序将使您的进一步处理更容易。要加速,请在users表中为列名添加索引。
还有其他Postgres解决此问题的方法,但上述方法适用于所有数据库。