总计一个表的每3行

时间:2012-06-29 20:15:29

标签: postgresql sum rows group-by window-functions

我有以下查询来每分钟计算所有数据。

$sql= "SELECT COUNT(*) AS count, date_trunc('minute', date) AS momento
FROM p WHERE fk_id_b=$id_b GROUP BY date_trunc('minute', date) 
ORDER BY momento ASC";

我需要做的是获取每行的计数总和以及过去2分钟的计数。

For example with the result of the $sql query above
|-------date---------|----count----|
|2012-06-21 05:20:00 |      12     |
|2012-06-21 05:21:00 |      14     |
|2012-06-21 05:22:00 |      10     |
|2012-06-21 05:23:00 |      20     |
|2012-06-21 05:24:00 |      25     |
|2012-06-21 05:25:00 |      30     |
|2012-06-21 05:26:00 |      10     |  

I want this result:

|-------date---------|----count----|
|2012-06-21 05:20:00 |      12     |   
|2012-06-21 05:21:00 |      26     |     12+14
|2012-06-21 05:22:00 |      36     |     12+14+10
|2012-06-21 05:23:00 |      44     |     14+10+20
|2012-06-21 05:24:00 |      55     |     10+20+25
|2012-06-21 05:25:00 |      75     |     20+25+30
|2012-06-21 05:26:00 |      65     |     25+30+10

3 个答案:

答案 0 :(得分:11)

使用lag() window function(也在SQL Fiddle上)时,这并不是那么棘手:

CREATE TABLE t ("date" timestamptz, "count" int4);
INSERT INTO t VALUES
('2012-06-21 05:20:00',12),
('2012-06-21 05:21:00',14),
('2012-06-21 05:22:00',10),
('2012-06-21 05:23:00',20),
('2012-06-21 05:24:00',25),
('2012-06-21 05:25:00',30),
('2012-06-21 05:26:00',10);

SELECT *,
    "count"
    + coalesce(lag("count", 1) OVER (ORDER BY "date"), 0)
    + coalesce(lag("count", 2) OVER (ORDER BY "date"), 0) AS "total"
  FROM t;
  1. 我引用了datecount列,因为这些是保留字;
  2. lag(field, distance)为我提供了距离当前行fielddistance行的值,因此第一个函数给出了前一行的值,第二个调用给出了前一行的值;
  3. coalesce()需要避免来自NULL函数的lag()结果(对于查询中的第一行,没有“前一个”,因此它是NULL),否则total也将是NULL

答案 1 :(得分:11)

这是针对当前行和前N行(在您的情况下N = 2)的值之和的更通用的解决方案。

SELECT "date", 
sum("count") OVER (order by "date" ROWS BETWEEN 2 preceding AND current row)
FROM t
ORDER BY "date";

您可以在0和“Unbounded”之间更改N.这种方法让您有机会在您的应用中拥有一个参数“N过去几分钟的计数”。此外,如果超出范围,则无需处理默认值。

您可以在PostgreSQL文档(4.2.8. Window Function Calls

中找到更多相关信息

答案 2 :(得分:9)

@vyegorov's answer主要涵盖了它。但是我有更多的抱怨而不适合评论。

  1. 请勿使用date之类的reserved wordscount作为的标识符。 PostgreSQL允许这两个特定的关键词作为标识符 - 除了每个SQL标准。但这仍然是不好的做法。您可以使用双引号内的任何内容作为标识符的事实,即使"; DELETE FROM tbl;"也不是一个好主意。 "date"的名称timestamp会引起误导。

  2. 错误的数据类型。示例显示timestamp,而非timestamptz。这里没有什么区别,但仍然具有误导性。

  3. 您不需要COALESCE()。使用window functions lag() and lead(),您可以提供默认值作为第三个参数:

  4. 在此设置的基础上:

    CREATE TABLE tbl (ts timestamp, ct int4);
    INSERT INTO tbl VALUES
      ('2012-06-21 05:20:00', 12)
    , ('2012-06-21 05:21:00', 14)
    , ('2012-06-21 05:22:00', 10)
    , ('2012-06-21 05:23:00', 20)
    , ('2012-06-21 05:24:00', 25)
    , ('2012-06-21 05:25:00', 30)
    , ('2012-06-21 05:26:00', 10);
    

    查询:

    SELECT ts, ct + lag(ct, 1, 0) OVER (ORDER BY ts)
                  + lag(ct, 2, 0) OVER (ORDER BY ts) AS total
    FROM   tbl;
    

    更好:使用单个sum()作为窗口聚合函数,并使用custom window frame

    SELECT ts, sum(ct) OVER (ORDER BY ts ROWS BETWEEN 2 PRECEDING AND CURRENT ROW)
    FROM   tbl;
    

    同样的结果。
    相关: