转置PostgreSQL表或聚合函数什么都不做

时间:2014-08-21 06:59:18

标签: sql postgresql pivot crosstab

我有一个PostgreSQL表,我必须转置 原始数据如下:

user_id role_id assigned
P0001   SA      t
P0001   Guest   t
P0002   SA      f
P0002   Guest   t

转置后,它应如下所示:

user_id SA  Guest
P0001   t   t
P0002   f   t

以下是我用来生成转置表的内容:

SELECT user_id, 
CAST(CAST(CASE role_id WHEN 'SA' THEN 1 ELSE 0 END) AS int) AS boolean) AS "SA",
CAST(CAST((CASE role_id WHEN 'Guest' THEN 1 ELSE 0 END) AS int) AS boolean) AS "Guest" 
FROM user_to_roles GROUP BY user_id

但它看起来很难看。有没有办法编写自定义聚合函数,只返回原始值。所以上面的陈述可以重写为:

SELECT user_id, 
Do_Nothing(CASE role_id WHEN 'SA' THEN true ELSE false END) AS "SA",
Do_Nothing(CASE role_id WHEN 'Guest' THEN true ELSE false END) AS "Guest" 
FROM user_to_roles GROUP BY user_id

编辑:

实际上,我需要一个动态生成的列,并在this article的帮助下使用光标实现它。我查看了文档并编写了这样的自定义聚合:

CREATE AGGREGATE do_nothing(anyelement) (
  SFUNC=donothing,
  STYPE=anyelement,
  INITCOND=''
);

CREATE OR REPLACE FUNCTION donothing(anyelement var)
  RETURNS anyelement AS
$BODY$
    RETURN var;
$BODY$
  LANGUAGE sql IMMUTABLE
  COST 100;

由于我想将其设为通用,因此此处使用了anyelment 但上面的代码根本不起作用。

2 个答案:

答案 0 :(得分:1)

在您的特定情况下,您可以使用内置聚合bool_or。类似的东西:

SELECT user_id, 
bool_or(CASE role_id WHEN 'SA'    THEN assigned ELSE false END) AS "SA",
bool_or(CASE role_id WHEN 'Guest' THEN assigned ELSE false END) AS "Guest" 
FROM user_to_roles GROUP BY user_id

答案 1 :(得分:1)

crosstab()

SELECT * FROM crosstab(
       'SELECT user_id, role_id, assigned
        FROM   tbl
        ORDER  BY 1,2'

      ,$$VALUES ('SA'::text), ('Guest')$$)
AS ct (user_id text, "SA" bool, "Guest" bool);

与当前版本的Postgres一样,快速。 (比下面的替代品更快。)

但这些解决方案都不是完全动态的,而且不完全可能

对于完全动态的解决方案,您必须输出数组或其他容器类型以返回可变数量的列。最近的相关问题与答案:

穷人的交叉表带有汇总的CASE表达式

仅列出几列:简单CASE语句与聚合函数相结合。

min()max()适用于大多数基本类型... per documentation

  

任何数组,数字,字符串或日期/时间类型

但不适用于boolean。使用bool_or()之类的FALSE OR NULL NULL会产生bool_or(),但所有提到的汇总函数(包括NULL忽略 NULL,因此它适用于SELECT user_id ,bool_or(CASE WHEN role_id = 'SA' THEN assigned ELSE NULL END) AS "SA" ,bool_or(CASE WHEN role_id = 'Guest' THEN assigned ELSE NULL END) AS "Guest" FROM tbl GROUP BY 1 ORDER BY 1; 同样。

CREATE OR REPLACE FUNCTION f_echo1(anyelement,anyelement)
  RETURNS anyelement AS 'SELECT $1' LANGUAGE sql IMMUTABLE STRICT;

CREATE AGGREGATE first_notnull(anyelement) (
   SFUNC = f_echo1
 , STYPE = anyelement
);

您必须适应预期的数据类型。

任何类型

的自定义聚合

没有标准的聚合函数可以按照您需要的方式适用于任何数据类型。你可以创建一个:

NULL

这是您在编辑中概述的简单实用版本:
INITCOND(无STRICT)开始,使用SELECT user_id ,first_notnull(CASE WHEN role_id = 'SA' THEN assigned ELSE NULL END) AS "SA" ,first_notnull(CASE WHEN role_id = 'Guest' THEN assigned ELSE NULL END) AS "Guest" FROM tbl GROUP BY 1 ORDER BY 1; 转换函数,它采用第一个非空值,转换函数只保留该值。所以我们得到聚合函数遇到的第一个非空值。

这适用于任何输入类型:

bool_or()

max()复制为bool_or

sql或plpgsql中的自定义聚合函数比内置函数慢得多,内置函数用C语言编写并进行了优化。你可以自己在C中写一个。不会那么难。或者,您可以在max中以pg_proc的名称复制pg_aggregate的定义,并在max()中的另一个副本中引用它,以使boolean适用于{{ 1}}。但是,不建议临时用户使用目录表进行混淆。如果你打破了某些东西,你的系统可能会变得瘫痪......