SQL中的序列编号

时间:2017-03-16 10:18:28

标签: sql sequence vertica

我列出了某些活动的活动清单(A-start to H-end)。这些可以以任何顺序发生,任何次数也可以重新启动。我需要确定活动中的活动块。

例如: A BCDEFG H BCD H CDEF < em> H EFG H

它只启动一次(A)但多次结束

需要对这些活动进行编号以识别集合(结束了多少次)

output: 1 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5

这有助于我确定事件结束(H)5-1 = 4次

2 个答案:

答案 0 :(得分:2)

看起来你想在给定值之前计算“H”和“A”的数量。这需要一个指定排序的列。我假设此列名为id

然后,您可以使用窗口函数执行此操作:

select t.*,
       sum(case when col = 'H' then 1 else 0 end) over (partition by grp order by id) + 1 as output
from (select t.*,
             sum(case when col = 'A' then 1 else 0 end) over (order by id) as grp
      from t
     ) t;

子查询通过执行“A”的累积和来定义“活动”组。外部查询然后通过执行“E”的累积和来定义“事件”组。

老实说,我不知道“H”是前一个值还是下一个值的一部分。如果是下一个值,那么查询可以使用window子句或略微调整逻辑:

       (sum(case when col = 'H' then 1 else 0 end) over (partition by grp order by id) +
        (case when col = 'H' then 0 else 1 end)
       ) as output

答案 1 :(得分:2)

如果您的活动是一系列事件,请尝试使用MATCH()子句及其相关函数event_name()pattern_id()match_id()

我刚用输入字母创建了一个时间序列,间隔一个小时,并应用了MATCH()子句。如果PATTERN pat AS ()子句不可思议地提醒您grep表达式,那就是它的工作方式。

只要看一下查询的输出 - 想象一下你可以用pattern_id - 和match_id来做多少有趣的事情,你可以用它们进行分组,例如,在随后的SELECT-s ......

WITH 
s(tm,event) AS (
          SELECT TIME '00:00:00','A'
UNION ALL SELECT TIME '01:00:00','B'
UNION ALL SELECT TIME '02:00:00','C'
UNION ALL SELECT TIME '03:00:00','D'
UNION ALL SELECT TIME '04:00:00','E'
UNION ALL SELECT TIME '05:00:00','F'
UNION ALL SELECT TIME '06:00:00','G'
UNION ALL SELECT TIME '07:00:00','H'
UNION ALL SELECT TIME '08:00:00','B'
UNION ALL SELECT TIME '09:00:00','C'
UNION ALL SELECT TIME '10:00:00','D'
UNION ALL SELECT TIME '11:00:00','H'
UNION ALL SELECT TIME '12:00:00','C'
UNION ALL SELECT TIME '13:00:00','D'
UNION ALL SELECT TIME '14:00:00','E'
UNION ALL SELECT TIME '15:00:00','F'
UNION ALL SELECT TIME '16:00:00','H'
UNION ALL SELECT TIME '17:00:00','E'
UNION ALL SELECT TIME '18:00:00','F'
UNION ALL SELECT TIME '19:00:00','G'
UNION ALL SELECT TIME '20:00:00','H'
)
SELECT
  *
, event_name()
, pattern_id()
, match_id()
FROM s
MATCH(
  PARTITION BY 1 -- nothing to partition by
  ORDER BY tm
  DEFINE  
    START_ev AS (event='A')
  , any_ev   AS (event NOT IN ('A','H'))
  , END_ev   AS (event='H')
  PATTERN pat AS (start_ev* any_ev+ end_ev)
  ROWS MATCH FIRST EVENT
);

tm      |event|event_name|pattern_id|match_id
00:00:00|A    |START_ev  |         1|       1
01:00:00|B    |any_ev    |         1|       2
02:00:00|C    |any_ev    |         1|       3
03:00:00|D    |any_ev    |         1|       4
04:00:00|E    |any_ev    |         1|       5
05:00:00|F    |any_ev    |         1|       6
06:00:00|G    |any_ev    |         1|       7
07:00:00|H    |END_ev    |         1|       8
08:00:00|B    |any_ev    |         2|       1
09:00:00|C    |any_ev    |         2|       2
10:00:00|D    |any_ev    |         2|       3
11:00:00|H    |END_ev    |         2|       4
12:00:00|C    |any_ev    |         3|       1
13:00:00|D    |any_ev    |         3|       2
14:00:00|E    |any_ev    |         3|       3
15:00:00|F    |any_ev    |         3|       4
16:00:00|H    |END_ev    |         3|       5
17:00:00|E    |any_ev    |         4|       1
18:00:00|F    |any_ev    |         4|       2
19:00:00|G    |any_ev    |         4|       3
20:00:00|H    |END_ev    |         4|       4