我列出了某些活动的活动清单(A-start to H-end)。这些可以以任何顺序发生,任何次数也可以重新启动。我需要确定活动中的活动块。
例如: A BCDEFG H BCD H CDEF < em> H EFG H
它只启动一次(A)但多次结束
需要对这些活动进行编号以识别集合(结束了多少次)
output: 1 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5
这有助于我确定事件结束(H)5-1 = 4次
答案 0 :(得分:2)
看起来你想在给定值之前计算“H”和“A”的数量。这需要一个指定排序的列。我假设此列名为id
。
然后,您可以使用窗口函数执行此操作:
select t.*,
sum(case when col = 'H' then 1 else 0 end) over (partition by grp order by id) + 1 as output
from (select t.*,
sum(case when col = 'A' then 1 else 0 end) over (order by id) as grp
from t
) t;
子查询通过执行“A”的累积和来定义“活动”组。外部查询然后通过执行“E”的累积和来定义“事件”组。
老实说,我不知道“H”是前一个值还是下一个值的一部分。如果是下一个值,那么查询可以使用window子句或略微调整逻辑:
(sum(case when col = 'H' then 1 else 0 end) over (partition by grp order by id) +
(case when col = 'H' then 0 else 1 end)
) as output
答案 1 :(得分:2)
如果您的活动是一系列事件,请尝试使用MATCH()
子句及其相关函数event_name()
,pattern_id()
和match_id()
。
我刚用输入字母创建了一个时间序列,间隔一个小时,并应用了MATCH()
子句。如果PATTERN pat AS ()
子句不可思议地提醒您grep
表达式,那就是它的工作方式。
只要看一下查询的输出 - 想象一下你可以用pattern_id
- 和match_id
来做多少有趣的事情,你可以用它们进行分组,例如,在随后的SELECT-s ......
WITH
s(tm,event) AS (
SELECT TIME '00:00:00','A'
UNION ALL SELECT TIME '01:00:00','B'
UNION ALL SELECT TIME '02:00:00','C'
UNION ALL SELECT TIME '03:00:00','D'
UNION ALL SELECT TIME '04:00:00','E'
UNION ALL SELECT TIME '05:00:00','F'
UNION ALL SELECT TIME '06:00:00','G'
UNION ALL SELECT TIME '07:00:00','H'
UNION ALL SELECT TIME '08:00:00','B'
UNION ALL SELECT TIME '09:00:00','C'
UNION ALL SELECT TIME '10:00:00','D'
UNION ALL SELECT TIME '11:00:00','H'
UNION ALL SELECT TIME '12:00:00','C'
UNION ALL SELECT TIME '13:00:00','D'
UNION ALL SELECT TIME '14:00:00','E'
UNION ALL SELECT TIME '15:00:00','F'
UNION ALL SELECT TIME '16:00:00','H'
UNION ALL SELECT TIME '17:00:00','E'
UNION ALL SELECT TIME '18:00:00','F'
UNION ALL SELECT TIME '19:00:00','G'
UNION ALL SELECT TIME '20:00:00','H'
)
SELECT
*
, event_name()
, pattern_id()
, match_id()
FROM s
MATCH(
PARTITION BY 1 -- nothing to partition by
ORDER BY tm
DEFINE
START_ev AS (event='A')
, any_ev AS (event NOT IN ('A','H'))
, END_ev AS (event='H')
PATTERN pat AS (start_ev* any_ev+ end_ev)
ROWS MATCH FIRST EVENT
);
tm |event|event_name|pattern_id|match_id
00:00:00|A |START_ev | 1| 1
01:00:00|B |any_ev | 1| 2
02:00:00|C |any_ev | 1| 3
03:00:00|D |any_ev | 1| 4
04:00:00|E |any_ev | 1| 5
05:00:00|F |any_ev | 1| 6
06:00:00|G |any_ev | 1| 7
07:00:00|H |END_ev | 1| 8
08:00:00|B |any_ev | 2| 1
09:00:00|C |any_ev | 2| 2
10:00:00|D |any_ev | 2| 3
11:00:00|H |END_ev | 2| 4
12:00:00|C |any_ev | 3| 1
13:00:00|D |any_ev | 3| 2
14:00:00|E |any_ev | 3| 3
15:00:00|F |any_ev | 3| 4
16:00:00|H |END_ev | 3| 5
17:00:00|E |any_ev | 4| 1
18:00:00|F |any_ev | 4| 2
19:00:00|G |any_ev | 4| 3
20:00:00|H |END_ev | 4| 4