我有以下数据:
StartDate EndDate Duration
----------
41890 41892 3
41898 41900 3
41906 41907 2
41910 41910 1
StartDate和EndDate是日历中任何日期的相应ID值。我想计算连续几天的持续时间总和。在这里,我想包括周末的日子。例如。在上面的数据中,让我们说41908和41909是周末,那么我所需的结果集应该如下所示。
我已经有另一个可以在下一个工作日返回给我的程序,即如果我在该程序中通过41907或41908或41909作为DateID,它将在下一个工作日返回41910。基本上我想检查当我传递上面的EndDateID时我的proc返回的DateID是否与上面数据中的下一个StartDateID相同,那么这两行应该是俱乐部。以下是我想要的数据。
ID StartDate EndDate Duration
----------
278457 41890 41892 3
278457 41898 41900 3
278457 41906 41910 3
如果要求不明确,请告诉我,我可以进一步解释。
我的日期表如下:
DateId Date Day
----------
41906 09-04-2014 Thursday
41907 09-05-2014 Friday
41908 09-06-2014 Saturdat
41909 09-07-2014 Sunday
41910 09-08-2014 Monday
以下是用于设置的SQL代码:
CREATE TABLE Table1
(
StartDate INT,
EndDate INT,
LeaveDuration INT
)
INSERT INTO Table1
VALUES(41890, 41892, 3),
(41898, 41900, 3),
(41906, 41907, 3),
(41910, 41910, 1)
CREATE TABLE DateTable
(
DateID INT,
Date DATETIME,
Day VARCHAR(20)
)
INSERT INTO DateTable
VALUES(41907, '09-05-2014', 'Friday'),
(41908, '09-06-2014', 'Saturday'),
(41909, '09-07-2014', 'Sunday'),
(41910, '09-08-2014', 'Monday'),
(41911, '09-09-2014', 'Tuesday')
答案 0 :(得分:2)
这很复杂。这是一种使用窗口函数的方法。
首先,使用日期表来枚举没有周末的日期(如果需要,您也可以休假)。然后,使用非等值连接将每个句点扩展为每行一天。
然后,您可以使用技巧来识别连续日期。这个技巧是为每个id生成一个序列号,并从日期的序号中减去它。这是连续几天的常数。最后一步只是一个聚合。
结果查询如下:
with d as (
select d.*, row_number() over (order by date) as seqnum
from dates d
where day not in ('Saturday', 'Sunday')
)
select t.id, min(t.date) as startdate, max(t.date) as enddate, sum(duration)
from (select t.*, ds.seqnum, ds.date,
(d.seqnum - row_number() over (partition by id order by ds.date) ) as grp
from table t join
d ds
on ds.date between t.startdate and t.enddate
) t
group by t.id, grp;
编辑:
以下是this SQL小提琴上的版本:
with d as (
select d.*, row_number() over (order by date) as seqnum
from datetable d
where day not in ('Saturday', 'Sunday')
)
select t.id, min(t.date) as startdate, max(t.date) as enddate, sum(duration)
from (select t.*, ds.seqnum, ds.date,
(ds.seqnum - row_number() over (partition by id order by ds.date) ) as grp
from (select t.*, 'abc' as id from table1 t) t join
d ds
on ds.dateid between t.startdate and t.enddate
) t
group by grp;
我相信这是有效的,但是日期表并没有包含所有日期。