每个记录的Postgresql时间序列

时间:2017-02-23 14:02:08

标签: postgresql time-series aggregate timeserieschart

我在试图解决如何从Postgres数据库中提取一些时间序列统计信息时遇到了问题。

例如,我有几家商店。我记录每个商店每天在一张看起来像这样的表中销售的数量:

+------------+----------+-------+
|    Date    | Store ID | Count |
+------------+----------+-------+
| 2017-02-01 |        1 |    10 |
| 2017-02-01 |        2 |    20 |
| 2017-02-03 |        1 |    11 |
| 2017-02-03 |        2 |    21 |
| 2017-02-04 |        3 |    30 |
+------------+----------+-------+

我试图在条形图/折线图上显示这些数据,每个商店使用不同的行,空白日期用0填充。

我成功地使用generate_series显示每天的总和(将所有商店合并为一个总和),但我无法弄清楚如何将其分开,以便每个商店都有每天的价值......结果如下:

["Store ID 1", 10, 0, 11,  0]
["Store ID 2", 20, 0, 21,  0]
["Store ID 3",  0, 0,  0, 30]

1 个答案:

答案 0 :(得分:2)

有必要建立交叉连接日期X商店:

select store_id, array_agg(total order by date) as total
from (
    select store_id, date, coalesce(sum(total), 0) as total
    from
        t
        right join (
            generate_series(
                (select min(date) from t),
                (select max(date) from t),
                '1 day'
            ) gs (date)
            cross join
            (select distinct store_id from t) s
        ) using (date, store_id)
    group by 1,2
) s
group by 1
order by 1
;
 store_id |    total    
----------+-------------
        1 | {10,0,11,0}
        2 | {20,0,21,0}
        3 | {0,0,0,30}

示例数据:

create table t (date date, store_id int, total int);
insert into t (date, store_id, total) values
('2017-02-01',1,10),
('2017-02-01',2,20),
('2017-02-03',1,11),
('2017-02-03',2,21),
('2017-02-04',3,30);