Postgres查询返回的不仅仅是array_agg

时间:2012-09-11 13:38:12

标签: postgresql postgresql-8.4

这是数据的格式化方式:

item_name | item_serial | sub_group | conc_stuff | other_data | more_data
----------+-------------+-----------+------------+------------+-----------
foo        bar-01-a      widget      b-3          towel        dent
foo        bar-02-a      widget      a-1          42           mouse
foo        bar-03-a      widget      p-1          babel        dolphin
foo3       bar-21-f      widget      f-1          42           marvin
foo3       bar-22-f      widget      x-1          poetry       vogon

我已经让查询以我想要的方式执行,问题是我需要返回更多数据。

SELECT item_name, 
       array_to_string(array_agg(conc_stuff), ',') as stuff 
FROM dataset 
WHERE some_selector = 'X' 
GROUP BY item_name 
ORDER BY item_name;

我尝试过对我来说简单但合乎逻辑的事情:

SELECT item_name, 
       item_serial, 
       sub_group, 
       array_to_string(array_agg(conc_stuff), ',') as stuff 
FROM dataset 
WHERE some_selector = 'X' 
GROUP BY item_name 
ORDER BY item_name;

我需要返回看起来像这样的内容:

item_name | item_serial | sub_group |   stuff
----------+-------------+-----------+-------------
foo        bar-01-a      widget      a-1,b-3,p-1
foo3       bar-21-f      widget      f-1,x-1,g-5
foo6       bar-81-z      widget      r-1,d-8,w-0

而不仅仅是这个:

item_name |   stuff
----------+--------------
foo        a-1,b-3,p-1
foo3       f-1,x-1,g-5
foo6       r-1,d-8,w-0

当我尝试向查询添加其他字段时,我得到:

ERROR: column "stuff.item_serial" must appear in the GROUP BY clause or be used in an aggregate function

但是我不想GROUP BY item_serial,我只是想让它与聚合一起返回,对吗?

我是否需要运行子查询?我相信这很简单。如果有多种方法,哪种方法效率最高?我将连接的一些文本是坐标(大文本字符串)。

2 个答案:

答案 0 :(得分:2)

您需要为每个名称选择一个值。您不能将每个名称仅返回一次,而是多次返回item_serial值。

从组合值中选取一个值是通过聚合函数完成的:

SELECT item_name,
       min(item_serial),
       min(sub_group),
       array_to_string(array_agg(conc_stuff),',') AS stuff
FROM dataset
WHERE sub_group = 'widget'
GROUP BY item_name
ORDER BY item_name;

这会为每个名称选择“第一个”item_serialsub_group

如果您想要最后一个值,请改用max

但要理解的重要一点是,您必须为非分组列选择一个值。而且你需要通过提供一个选择一个值的聚合函数来告诉DBMS它应该使用哪一个。

SQLFiddle示例:http://www.sqlfiddle.com/#!1/58009/1

答案 1 :(得分:1)

对于这一点,Postgres 8.4比更新版本的Pg稍微严格一些。使用GROUP BY时,所有不包含聚合函数的字段都需要进行分组。

从Pg9.1开始,如果您是GROUP BY主键,则可以省略所有其他非分组字段。

希望它有所帮助。

编辑:

SELECT 
  item_name, 
  item_serial, 
  sub_group, 
  array_to_string(array_agg(conc_stuff), ',') as stuff 
FROM 
  dataset 
WHERE 
  some_selector = 'X' 
GROUP BY 
  item_name,
  item_serial,
  sub_group 
ORDER BY 
  item_name;