我一直在将一些MySQL查询迁移到PostgreSQL以使用Heroku。我的大多数查询都运行正常,但是当我使用group by时,我仍然遇到类似的重复错误:
错误:列“XYZ”必须出现在GROUP BY子句中或用于 聚合函数
有人能告诉我我做错了吗?
MySQL 100%工作:
SELECT `availables`.*
FROM `availables`
INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id
WHERE (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
GROUP BY availables.bookdate
ORDER BY availables.updated_at
PostgreSQL错误:
ActiveRecord :: StatementInvalid:PGError:ERROR:列 “availables.id”必须出现在GROUP BY子句中或用于 总功能:
选择“availables”。* FROM“availables”INNER 在“房间”上加入“房间”.id =“availables”.room_id在哪里 (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN E'2009-10-21' AND E'2009-10-23')GROUP BY availables.bookdate ORDER BY availables.updated_at
生成SQL的Ruby代码:
expiration = Available.find(:all,
:joins => [ :room ],
:conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
:group => 'availables.bookdate',
:order => 'availables.updated_at')
预期输出(来自MySQL查询):
+-----+-------+-------+------------+---------+---------------+---------------+ | id | price | spots | bookdate | room_id | created_at | updated_at | +-----+-------+-------+------------+---------+---------------+---------------+ | 414 | 38.0 | 1 | 2009-11-22 | 1762 | 2009-11-20... | 2009-11-20... | | 415 | 38.0 | 1 | 2009-11-23 | 1762 | 2009-11-20... | 2009-11-20... | | 416 | 38.0 | 2 | 2009-11-24 | 1762 | 2009-11-20... | 2009-11-20... | +-----+-------+-------+------------+---------+---------------+---------------+ 3 rows in set
答案 0 :(得分:107)
MySQL完全不符合标准的GROUP BY
可以由Postgres'DISTINCT ON
模仿。考虑一下:
SELECT a,b,c,d,e FROM table GROUP BY a
这为a
的每个值提供了1行(哪一个,你真的不知道)。实际上你可以猜到,因为MySQL不知道哈希聚合,所以它可能会使用排序......但它只会在a
上排序,所以行的顺序可能是随机的。除非它使用多列索引而不是排序。好吧,无论如何,它没有被查询指定。
SELECT DISTINCT ON (a) a,b,c,d,e FROM table ORDER BY a,b,c
这为a
的每个值提供了1行,根据查询指定的ORDER BY
,此行将是排序中的第一行。简单。
请注意,这里不是我正在计算的聚合。所以GROUP BY
实际上毫无意义。 DISTINCT ON
更有意义。
Rails与MySQL结合在一起,所以我对它产生的SQL在Postgres中不起作用并不感到惊讶。
答案 1 :(得分:16)
PostgreSQL比MySQL更符合SQL。输出中的所有字段(除具有聚合函数的计算字段)必须存在于GROUP BY子句中。
答案 2 :(得分:8)
MySQL的GROUP BY可以在没有聚合函数的情况下使用(这与SQL标准相反),并返回组中的第一行(我不知道基于什么标准),而PostgreSQL必须具有聚合函数列上的(MAX,SUM等),在其上发布GROUP BY子句。
答案 3 :(得分:4)
正确,修复此问题的解决方法是使用:选择并选择您希望用结果对象装饰的每个字段。
令人讨厌 - 但是分组的工作原理是什么,而不是MySQL如何通过猜测你的意思,如果你不在你的组中粘贴字段,那么它是如何工作的。
答案 4 :(得分:3)
如果我没记错的话,在PostgreSQL中你必须添加从GROUP BY子句将应用于 GROUP BY子句的表中提取的每一列。
答案 5 :(得分:2)
不是最漂亮的解决方案,但更改group参数以输出模型中的每一列都在PostgreSQL中工作:
expiration = Available.find(:all,
:joins => [ :room ],
:conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
:group => Available.column_names.collect{|col| "availables.#{col}"},
:order => 'availables.updated_at')
答案 6 :(得分:1)
根据MySQL“Debunking GROUP BY Myths”http://dev.mysql.com/tech-resources/articles/debunking-group-by-myths.html。 SQL(标准的2003版本)不要求查询的SELECT列表中引用的列也出现在GROUP BY子句中。
答案 7 :(得分:1)
对于其他人在postgresql中寻找任何字段(包括连接字段)的订购方式,请使用子查询:
SELECT * FROM(
SELECT DISTINCT ON(availables.bookdate) `availables`.*
FROM `availables` INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id
WHERE (rooms.hotel_id = 5056
AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
) AS distinct_selected
ORDER BY availables.updated_at
or arel:
subquery = SomeRecord.select("distinct on(xx.id) xx.*, jointable.order_field")
.where("").joins(")
result = SomeRecord.select("*").from("(#{subquery.to_sql}) AS distinct_selected").order(" xx.order_field ASC, jointable.order_field ASC")
答案 8 :(得分:0)
我认为.uniq [1]会解决你的问题。
[1] Available.select('...').uniq
查看http://guides.rubyonrails.org/active_record_querying.html#selecting-specific-fields