当几个月没有休息时,需要获得最小开始日期和最长结束日期

时间:2015-10-01 16:21:03

标签: sql

我有8行,如下所示,

Column1 Start_date  end_date    Row_number
1       2014-02-01  2014-02-28  1
1       2014-03-01  2014-03-31  2
1       2014-04-01  2014-04-30  3
1       2014-05-01  2014-05-31  4
1       2014-07-01  2014-07-31  5
1       2015-02-01  2015-02-28  6
1       2015-03-01  2015-03-31  7

我需要如下结果,

Column1 Start_date  end_date
1       2014-02-01  2014-05-31
1       2014-07-01  2014-07-31
1       2015-02-01  2015-03-31

所以当第一行的end_date比下一行的start_date小一天时,我需要像这样对所有连续行进行分组,并得到我显示的结果。我只需要通过SQL来做这件事。请让我知道,如果有人有任何想法解决这个问题。

在输入记录中,您可以看到,前4行是连续的,第5行不是连续的,第6行和第7行是连续的。

提前致谢。

1 个答案:

答案 0 :(得分:2)

这里的诀窍是你需要首先过滤出作为间隔结束的条目,然后将它们合并在一起,而不是试图一次性保持运行计数。

所以我不知道你正在运行什么样的SQL,我不知道你试图用Column1表示什么,但这应该可以解决问题(用SQL Server编写)味道,但你需要调整的唯一功能是dateadd和isnull)。小提琴是here

SELECT DISTINCT 
CASE WHEN Q1.IsStart = 1 
     THEN Q1.start_date
     ELSE LAG(start_date) OVER(ORDER BY Q1.Row_number) END AS start_date,
CASE WHEN Q1.IsEnding = 1 
     THEN Q1.end_date
     ELSE LEAD(end_date) OVER(ORDER BY Q1.Row_number) END AS end_date
FROM
 (SELECT 
  start_date, 
  end_date, 
  Row_number,
  CASE WHEN DATEADD(day,1,end_date) = 
            ISNULL(LEAD(start_date) OVER(ORDER BY Row_number),
                   end_date)
       THEN 0 
       ELSE 1 END AS IsEnding,
  CASE WHEN DATEADD(day,-1,start_date) = 
            ISNULL(LAG(end_date) OVER(ORDER BY Row_number),
                   start_date)
       THEN 0
       ELSE 1 END AS IsStart
  FROM table1) Q1
WHERE Q1.IsEnding = 1 OR Q1.IsStart = 1

对于ANSI SQL /对于那些没有LAGLEAD的人:

SELECT 
  StartDates.start_date, 
  MIN(EndDates.end_date)
FROM
  (SELECT 
    MainEntry.start_date,
    MainEntry.row_number
   FROM
    mytable MainEntry 
    LEFT OUTER JOIN mytable PrevEntry ON PrevEntry.row_number - 1 = MainEntry.row_number
   WHERE
    PrevEntry.end_date IS NULL OR
    EXTRACT(day FROM (MainEntry.start_date - PrevEntry.end_date)) > 1) StartDates
  INNER JOIN
  (SELECT 
    MainEntry.end_date,
    MainEntry.row_number
   FROM
    mytable MainEntry 
    LEFT OUTER JOIN mytable NextEntry ON NextEntry.row_number + 1 = MainEntry.row_number
   WHERE
    NextEntry.start_date IS NULL OR
    EXTRACT(day FROM (NextEntry.start_date - MainEntry.end_date)) > 1) EndDates
  ON StartDates.row_number <= EndDates.row_number
GROUP BY 
  StartDates.start_date

请注意,GROUP BY如果利用了索引,则可能包含StartDates.row_number。另请注意,此ANSI解决方案最初错过了没有任何对的行的边缘情况(子查询中有INNER JOIN s)。