Question

我尝试通过3M表找到所有具有相同用户名的用户。我读到这样的东西可能会成功。

User.find(:all, :group => [:username], :having => "count(*) > 1" )

然而，因为我使用的是Postgres，所以请回复ActiveRecord::StatementInvalid: PG::Error: ERROR: column "users.id" must appear in the GROUP BY clause or be used in an aggregate function。

我正在尝试这样的事情

User.select('users.id, users.username').having("count(*) > 1").group('users.username')

但仍然得到同样的错误。知道我做错了吗？

更新：我使用User.select('users.*').group('users.id').having('count(users.username) > 1')以某种方式工作了但是这个查询返回了我看起来像一个空数组，即使它创建了5条记录。

 GroupAggregate  (cost=9781143.40..9843673.60 rows=3126510 width=1365)
   Filter: (count(username) > 1)
   ->  Sort  (cost=9781143.40..9788959.68 rows=3126510 width=1365)
         Sort Key: id
         ->  Seq Scan on users  (cost=0.00..146751.10 rows=3126510 width=1365)
(5 rows)

 => []

知道为什么会这样，以及如何获得这5行？

Answer 1

我认为你能得到的最好的方法是获取重复记录的用户名。这可以通过

来实现

User.select(:username).group(:username).having('COUNT(username) > 1')

Answer 2

数据库中的“group by”将每个组折叠为输出中的一行。您最有可能通过以下查询生成您想要的内容：

    User.where("name in (select name from users group by name having count(*)>1)").order(:name)

上面的内部查询查找出现多次的所有名称。然后我们找到具有这些名称的所有行。按名称排序将使您的进一步处理更容易。要加速，请在users表中为列名添加索引。

还有其他Postgres解决此问题的方法，但上述方法适用于所有数据库。

如何在postgres中执行此组ActiveRecord查询

2 个答案: