这是数据的格式化方式:
item_name | item_serial | sub_group | conc_stuff | other_data | more_data
----------+-------------+-----------+------------+------------+-----------
foo bar-01-a widget b-3 towel dent
foo bar-02-a widget a-1 42 mouse
foo bar-03-a widget p-1 babel dolphin
foo3 bar-21-f widget f-1 42 marvin
foo3 bar-22-f widget x-1 poetry vogon
我已经让查询以我想要的方式执行,问题是我需要返回更多数据。
SELECT item_name,
array_to_string(array_agg(conc_stuff), ',') as stuff
FROM dataset
WHERE some_selector = 'X'
GROUP BY item_name
ORDER BY item_name;
我尝试过对我来说简单但合乎逻辑的事情:
SELECT item_name,
item_serial,
sub_group,
array_to_string(array_agg(conc_stuff), ',') as stuff
FROM dataset
WHERE some_selector = 'X'
GROUP BY item_name
ORDER BY item_name;
我需要返回看起来像这样的内容:
item_name | item_serial | sub_group | stuff
----------+-------------+-----------+-------------
foo bar-01-a widget a-1,b-3,p-1
foo3 bar-21-f widget f-1,x-1,g-5
foo6 bar-81-z widget r-1,d-8,w-0
而不仅仅是这个:
item_name | stuff
----------+--------------
foo a-1,b-3,p-1
foo3 f-1,x-1,g-5
foo6 r-1,d-8,w-0
当我尝试向查询添加其他字段时,我得到:
ERROR: column "stuff.item_serial" must appear in the GROUP BY clause or be used in an aggregate function
但是我不想GROUP BY
item_serial,我只是想让它与聚合一起返回,对吗?
我是否需要运行子查询?我相信这很简单。如果有多种方法,哪种方法效率最高?我将连接的一些文本是坐标(大文本字符串)。
答案 0 :(得分:2)
您需要为每个名称选择一个值。您不能将每个名称仅返回一次,而是多次返回item_serial
值。
从组合值中选取一个值是通过聚合函数完成的:
SELECT item_name,
min(item_serial),
min(sub_group),
array_to_string(array_agg(conc_stuff),',') AS stuff
FROM dataset
WHERE sub_group = 'widget'
GROUP BY item_name
ORDER BY item_name;
这会为每个名称选择“第一个”item_serial
和sub_group
。
如果您想要最后一个值,请改用max
。
但要理解的重要一点是,您必须为非分组列选择一个值。而且你需要通过提供一个选择一个值的聚合函数来告诉DBMS它应该使用哪一个。
SQLFiddle示例:http://www.sqlfiddle.com/#!1/58009/1
答案 1 :(得分:1)
GROUP BY
时,所有不包含聚合函数的字段都需要进行分组。
从Pg9.1开始,如果您是GROUP BY
主键,则可以省略所有其他非分组字段。
希望它有所帮助。
编辑:
SELECT
item_name,
item_serial,
sub_group,
array_to_string(array_agg(conc_stuff), ',') as stuff
FROM
dataset
WHERE
some_selector = 'X'
GROUP BY
item_name,
item_serial,
sub_group
ORDER BY
item_name;