如何在postgres中执行此组ActiveRecord查询

时间:2013-07-12 18:39:21

标签: ruby-on-rails postgresql activerecord

我尝试通过3M表找到所有具有相同用户名的用户。我读到这样的东西可能会成功。

User.find(:all, :group => [:username], :having => "count(*) > 1" )

然而,因为我使用的是Postgres,所以请回复ActiveRecord::StatementInvalid: PG::Error: ERROR: column "users.id" must appear in the GROUP BY clause or be used in an aggregate function

我正在尝试这样的事情

User.select('users.id, users.username').having("count(*) > 1").group('users.username')

但仍然得到同样的错误。知道我做错了吗?

更新:我使用User.select('users.*').group('users.id').having('count(users.username) > 1')以某种方式工作了但是这个查询返回了我看起来像一个空数组,即使它创建了5条记录。

 GroupAggregate  (cost=9781143.40..9843673.60 rows=3126510 width=1365)
   Filter: (count(username) > 1)
   ->  Sort  (cost=9781143.40..9788959.68 rows=3126510 width=1365)
         Sort Key: id
         ->  Seq Scan on users  (cost=0.00..146751.10 rows=3126510 width=1365)
(5 rows)

 => [] 

知道为什么会这样,以及如何获得这5行?

2 个答案:

答案 0 :(得分:5)

我认为你能得到的最好的方法是获取重复记录的用户名。这可以通过

来实现
User.select(:username).group(:username).having('COUNT(username) > 1')

答案 1 :(得分:0)

数据库中的“group by”将每个组折叠为输出中的一行。您最有可能通过以下查询生成您想要的内容:

    User.where("name in (select name from users group by name having count(*)>1)").order(:name)

上面的内部查询查找出现多次的所有名称。然后我们找到具有这些名称的所有行。按名称排序将使您的进一步处理更容易。要加速,请在users表中为列名添加索引。

还有其他Postgres解决此问题的方法,但上述方法适用于所有数据库。