我有一个PostgreSQL表,我必须转置 原始数据如下:
user_id role_id assigned
P0001 SA t
P0001 Guest t
P0002 SA f
P0002 Guest t
转置后,它应如下所示:
user_id SA Guest
P0001 t t
P0002 f t
以下是我用来生成转置表的内容:
SELECT user_id,
CAST(CAST(CASE role_id WHEN 'SA' THEN 1 ELSE 0 END) AS int) AS boolean) AS "SA",
CAST(CAST((CASE role_id WHEN 'Guest' THEN 1 ELSE 0 END) AS int) AS boolean) AS "Guest"
FROM user_to_roles GROUP BY user_id
但它看起来很难看。有没有办法编写自定义聚合函数,只返回原始值。所以上面的陈述可以重写为:
SELECT user_id,
Do_Nothing(CASE role_id WHEN 'SA' THEN true ELSE false END) AS "SA",
Do_Nothing(CASE role_id WHEN 'Guest' THEN true ELSE false END) AS "Guest"
FROM user_to_roles GROUP BY user_id
实际上,我需要一个动态生成的列,并在this article的帮助下使用光标实现它。我查看了文档并编写了这样的自定义聚合:
CREATE AGGREGATE do_nothing(anyelement) (
SFUNC=donothing,
STYPE=anyelement,
INITCOND=''
);
CREATE OR REPLACE FUNCTION donothing(anyelement var)
RETURNS anyelement AS
$BODY$
RETURN var;
$BODY$
LANGUAGE sql IMMUTABLE
COST 100;
由于我想将其设为通用,因此此处使用了anyelment
但上面的代码根本不起作用。
答案 0 :(得分:1)
在您的特定情况下,您可以使用内置聚合bool_or。类似的东西:
SELECT user_id,
bool_or(CASE role_id WHEN 'SA' THEN assigned ELSE false END) AS "SA",
bool_or(CASE role_id WHEN 'Guest' THEN assigned ELSE false END) AS "Guest"
FROM user_to_roles GROUP BY user_id
答案 1 :(得分:1)
crosstab()
SELECT * FROM crosstab(
'SELECT user_id, role_id, assigned
FROM tbl
ORDER BY 1,2'
,$$VALUES ('SA'::text), ('Guest')$$)
AS ct (user_id text, "SA" bool, "Guest" bool);
与当前版本的Postgres一样,快速。 (比下面的替代品更快。)
但这些解决方案都不是完全动态的,而且不完全可能:
对于完全动态的解决方案,您必须输出数组或其他容器类型以返回可变数量的列。最近的相关问题与答案:
CASE
表达式仅列出几列:简单CASE
语句与聚合函数相结合。
min()
或max()
适用于大多数基本类型... per documentation:
任何数组,数字,字符串或日期/时间类型
但不适用于boolean
。使用bool_or()
之类的FALSE OR NULL
NULL
会产生bool_or()
,但所有提到的汇总函数(包括NULL
)忽略 NULL
,因此它适用于SELECT user_id
,bool_or(CASE WHEN role_id = 'SA' THEN assigned ELSE NULL END) AS "SA"
,bool_or(CASE WHEN role_id = 'Guest' THEN assigned ELSE NULL END) AS "Guest"
FROM tbl
GROUP BY 1
ORDER BY 1;
同样。
CREATE OR REPLACE FUNCTION f_echo1(anyelement,anyelement)
RETURNS anyelement AS 'SELECT $1' LANGUAGE sql IMMUTABLE STRICT;
CREATE AGGREGATE first_notnull(anyelement) (
SFUNC = f_echo1
, STYPE = anyelement
);
您必须适应预期的数据类型。
没有标准的聚合函数可以按照您需要的方式适用于任何数据类型。你可以创建一个:
NULL
这是您在编辑中概述的简单实用版本:
从INITCOND
(无STRICT
)开始,使用SELECT user_id
,first_notnull(CASE WHEN role_id = 'SA' THEN assigned ELSE NULL END) AS "SA"
,first_notnull(CASE WHEN role_id = 'Guest' THEN assigned ELSE NULL END) AS "Guest"
FROM tbl
GROUP BY 1
ORDER BY 1;
转换函数,它采用第一个非空值,转换函数只保留该值。所以我们得到聚合函数遇到的第一个非空值。
这适用于任何输入类型:
bool_or()
max()
复制为bool_or
sql或plpgsql中的自定义聚合函数比内置函数慢得多,内置函数用C语言编写并进行了优化。你可以自己在C中写一个。不会那么难。或者,您可以在max
中以pg_proc
的名称复制pg_aggregate
的定义,并在max()
中的另一个副本中引用它,以使boolean
适用于{{ 1}}。但是,不建议临时用户使用目录表进行混淆。如果你打破了某些东西,你的系统可能会变得瘫痪......