在Oracle SQL中基于时间的项目按重复分组运行总计

时间:2016-01-27 14:56:05

标签: sql oracle sum window-functions

我的第一篇文章,请耐心等待。我想根据一个按日期划分的值进行求和,但只想要日期的总和,而不是总计的逐项。几天来一直在努力,试图避免使用光标,但可能必须这样做。

以下是我正在查看的数据示例。顺便说一句,这是在Oracle 11g中。

 Key     Time               Amt
------ ------------------ ------
 Null    1-1-2016  00:00    50
 Null    1-1-2016  02:00    50
 Key1    1-1-2016  04:00    30
 Null    1-1-2016  06:00    30
 Null    1-1-2016  08:00    30
 Key2    1-1-2016  10:00    40
 Null    1-1-2016  12:00    40
 Key1    1-1-2016  14:00    30
 Null    1-2-2016  00:00    30
 Key2    1-2-2016  02:00    35

最终结果应如下所示:

 Key    Start            Stop             Amt
------ ---------------- ---------------- -----
 Null   1-1-2016 00:00   1-1-2016 02:00   100
 Key1   1-1-2016 04:00   1-1-2016 08:00    90
 Key2   1-1-2016 10:00   1-1-2016 12:00    80
 Key1   1-1-2016 14:00   1-2-2016 00:00    60
 key2   1-2-2016 02:00   1-2-2016 02:00    35

我已经能够获得密钥以填补空白。密钥并不总是输入,但假定为实际更改之前的值。

SELECT key ,time ,amt
FROM (
    SELECT DISTINCT amt, time, 
        ,last_value(amt ignore nulls) OVER (
            ORDER BY time
            ) key
    FROM sample
    ORDER BY time, amt
    )
WHERE amt > 0
ORDER BY time, key NULLS first;

但是当我试图获得一个总计时,即使是休息时它也会在键上求和。我无法弄清楚如何在钥匙上打破它。这是我最好的拍摄它不是很好,不能正常工作。

SELECT key,time, amt 
     , sum(amt) OVER (PARTITION BY key ORDER BY time) AS running_total
  FROM (SELECT key, time, amt
          FROM (SELECT DISTINCT
                         amt,
                         time, 
                         last_value(amt ignore nulls) OVER (ORDER BY time) key
                  FROM sample
                 ORDER BY time, amt
               )
         WHERE amt > 0
         ORDER BY time, key NULLS first
       )
ORDER BY time, key NULLS first;

任何帮助将不胜感激。也许使用光标是唯一的方法。

匹配样本数据。

3 个答案:

答案 0 :(得分:1)

为了获得您正在寻找的总和,您需要一种方法来对您感兴趣的值进行分组。您可以使用几个ROW_NUMBER分析函数生成分组ID,其中一个分区由核心价值。但是,由于您需要复制KEY列值,因此需要分几个阶段完成:

WITH t1 AS (
  SELECT dta.*
       , last_value(KEY IGNORE NULLS)          -- Fill in the missing
               OVER (ORDER BY TIME ASC) key2   -- key values
    FROM your_data dta
), t2 AS (
  SELECT t1.*
       , row_number() OVER (ORDER BY TIME)     -- Generate a
       - row_number() OVER (PARTITION BY key2  -- grouping ID
                                ORDER BY TIME) gp
    FROM t1
)
SELECT t2.*
     , sum(amt) OVER (PARTITION BY gp, key2
                          ORDER BY TIME) running_sums
  FROM t2;

上述查询创建了一个AMT的运行总和,每次键值更改时都会重新启动。以下用于代替上述最后一个select语句的查询给出了请求的结果,我不会将其称为运行总和。

SELECT key2
     , MIN(TIME) start_time
     , MAX(TIME) stop_time
     , sum(amt) amt
  FROM t2
 GROUP BY key2, gp;

要查看完整时间值,您可能需要更改会话NLS_DATE_FORMAT,如下所示:

ALTER SESSION SET NLS_DATE_FORMAT='DD-MM-RRRR HH24:MI:SS';

或者将每个日期列包装在TO_CHAR函数中以用于输出目的。

答案 1 :(得分:0)

我不确定您的示例数据与查询有什么关系(例如,您的示例数据是一个表,示例查询有很多查询)。但是,要分配密钥,您可以将LAG()IGNORE NULLS选项一起使用:

select s.*,
       lag(key ignore nulls) over (order by start) as new_key
from sample s;

然后,您想要将同一个键的组分组在一起。一种方法是行数的差异。最后一步是聚合:

select new_key, min(time), max(time), sum(amount)
from (select s.*,
             (row_number() over (order by start) -
              row_number() over (partition by new_key order by start)
             ) as grp
      from (select s.*,
                   lag(key ignore nulls) over (order by start) as new_key
            from sample s
           ) s
     ) s
group by new_key, grp;

答案 2 :(得分:0)

Key不为NULL时分配组号可以很容易地与LAG一起计算:

LAG(key ignore NULLS) OVER (ORDER BY time) AS new_key,
COUNT(key) OVER (ORDER BY time ROWS UNBOUNDED PRECEDING) AS grp