Postgres交叉表和聚合在一起

时间:2016-12-28 03:05:49

标签: sql postgresql crosstab data-analysis

我有一张像这样的表purchases

purchase_id|purchase_date|product_id
     1     | 2016-02-04  | 17
     2     | 2016-02-04  | 19
     3     | 2016-02-04  | 17
     ... About 1 million entries

和表格products是这样的:

product_id
   17
   18
   19
   ... About 30 entries

我想做一个交叉表查询,以便为我提供日期的总购买数量,并在每个product_id上进行调整,如下所示:

 purchase_date|product_id_17|product_id_18|product_id_19|product_id...
   2016-02-04 |   2         |  0          |  1          | ...
   2016-02-05 | ...

请注意,此表中的值取自任何记录,但匹配的记录数总和。我相信这可以使用crosstab和聚合来实现,但是我们无法弄清楚如何做到这一点。

  1. 可以使用Postgres完成吗?
  2. 交叉表是正确的方法吗?
  3. 如何?
  4. 我在这里的独特之处在于:

    • 做交叉链接
    • 做一个聚合
    • 同时

    请注意,有关Stack Overflow讨论交叉表的其他问题并没有解释如何进行交叉表和聚合。

1 个答案:

答案 0 :(得分:1)

以下为样本

表 -

 create table prods(purchase_id int,purchase_date date,product_id int);

数据 -

 insert into prods values (1,'2016-02-04',17);
 insert into prods values (2,'2016-02-04',19);
 insert into prods values (3,'2016-02-04',17);
 insert into prods values (4,'2016-02-05',17);
 insert into prods values (5,'2016-02-05',17);

要获得所需的输出,您可以使用crosstab() -

select *
from crosstab('
 select purchase_date
       ,product_id
       ,count(product_id)::int
from    prods
group by purchase_date
        ,product_id
order by purchase_date
        ,product_id
') as t("purchase_date" date
        ,"product_id_17" int
        ,"product_id_19" int
        )

输出 -

purchase_date product_id_17 product_id_19 
------------- ------------- ------------- 
2016-02-04    2             1             
2016-02-05    2             NULL