假设我有一个包含一组数据点的表,每个数据点由一个时间戳和一个值组成。如果至少有N个连续记录(按时间戳排序)高于给定值X,我将如何编写返回true(1)的查询,否则返回false(0)?
以下为3个连续记录执行此操作,但如果不构建动态查询并添加更多“和存在”的情况,则不适用于一般情况:
truncate table tblData
insert into tblData values ('1-jul-2013 13:01:00', 64)
insert into tblData values ('1-jul-2013 13:02:00', 13)
insert into tblData values ('1-jul-2013 13:03:00', 7)
insert into tblData values ('1-jul-2013 13:04:00', 17)
insert into tblData values ('1-jul-2013 13:05:00', 7)
insert into tblData values ('1-jul-2013 13:06:00', 18)
insert into tblData values ('1-jul-2013 13:07:00', 9)
insert into tblData values ('1-jul-2013 13:08:00', 20)
insert into tblData values ('1-jul-2013 13:09:00', 12)
insert into tblData values ('1-jul-2013 13:10:00', 21)
insert into tblData values ('1-jul-2013 13:11:00', 22)
insert into tblData values ('1-jul-2013 13:12:00', 3)
insert into tblData values ('1-jul-2013 13:13:00', 22)
insert into tblData values ('1-jul-2013 13:14:00', 20)
declare @x as int = 10
select count(*)
from tblData a
where a.dt in
(select dt from tblData b where b.value > @x and b.dt >= a.dt and b.dt < DATEADD(minute,1,a.dt)) and exists
(select dt from tblData b where b.value > @x and b.dt >= DATEADD(minute,1,a.dt) and b.dt < DATEADD(minute,2,a.dt)) and exists
(select dt from tblData b where b.value > @x and b.dt >= DATEADD(minute,2,a.dt) and b.dt < DATEADD(minute,3,a.dt))
想法?
答案 0 :(得分:3)
基本上,您需要一个标记的累积总和,表示该列超出了值@x
。
事实证明,你可以使用row_number()
进行一些技巧。使用row_number()
枚举所有行(按时间顺序)。然后,枚举所有行,按标志分区。它们之间的差异将是一个标识一组连续行的常量。然后,通过聚合,我们可以获得标志为真(或假)的连续值的最长长度:
select seqnum - seqnum_flag, count(*)
from (select d.*,
row_number() over (order by dt) as seqnum,
row_number() over (partition by (case when val > @x then 1 else 0 end)
order by dt) as seqnum_flag
from tblData d
) d
where val > @x
group by (seqnum - seqnum_flag);
返回每个序列及其长度。这应该为您提供进行所需的信息。
您可以在SQL Fiddle上看到它。
答案 1 :(得分:0)
您可以使用over ... rows N preceding
子句计算最后N行的最小值。例如,如果此行和最后3行的值大于10,则显示1:
select *
, case when min(val) over (order by dt rows 3 preceding) > 10 then 1 else 0 end
from tblData