我有8行,如下所示,
Column1 Start_date end_date Row_number
1 2014-02-01 2014-02-28 1
1 2014-03-01 2014-03-31 2
1 2014-04-01 2014-04-30 3
1 2014-05-01 2014-05-31 4
1 2014-07-01 2014-07-31 5
1 2015-02-01 2015-02-28 6
1 2015-03-01 2015-03-31 7
我需要如下结果,
Column1 Start_date end_date
1 2014-02-01 2014-05-31
1 2014-07-01 2014-07-31
1 2015-02-01 2015-03-31
所以当第一行的end_date比下一行的start_date小一天时,我需要像这样对所有连续行进行分组,并得到我显示的结果。我只需要通过SQL来做这件事。请让我知道,如果有人有任何想法解决这个问题。
在输入记录中,您可以看到,前4行是连续的,第5行不是连续的,第6行和第7行是连续的。
提前致谢。
答案 0 :(得分:2)
这里的诀窍是你需要首先过滤出作为间隔结束的条目,然后将它们合并在一起,而不是试图一次性保持运行计数。
所以我不知道你正在运行什么样的SQL,我不知道你试图用Column1表示什么,但这应该可以解决问题(用SQL Server编写)味道,但你需要调整的唯一功能是dateadd和isnull)。小提琴是here
SELECT DISTINCT
CASE WHEN Q1.IsStart = 1
THEN Q1.start_date
ELSE LAG(start_date) OVER(ORDER BY Q1.Row_number) END AS start_date,
CASE WHEN Q1.IsEnding = 1
THEN Q1.end_date
ELSE LEAD(end_date) OVER(ORDER BY Q1.Row_number) END AS end_date
FROM
(SELECT
start_date,
end_date,
Row_number,
CASE WHEN DATEADD(day,1,end_date) =
ISNULL(LEAD(start_date) OVER(ORDER BY Row_number),
end_date)
THEN 0
ELSE 1 END AS IsEnding,
CASE WHEN DATEADD(day,-1,start_date) =
ISNULL(LAG(end_date) OVER(ORDER BY Row_number),
start_date)
THEN 0
ELSE 1 END AS IsStart
FROM table1) Q1
WHERE Q1.IsEnding = 1 OR Q1.IsStart = 1
对于ANSI SQL /对于那些没有LAG
或LEAD
的人:
SELECT
StartDates.start_date,
MIN(EndDates.end_date)
FROM
(SELECT
MainEntry.start_date,
MainEntry.row_number
FROM
mytable MainEntry
LEFT OUTER JOIN mytable PrevEntry ON PrevEntry.row_number - 1 = MainEntry.row_number
WHERE
PrevEntry.end_date IS NULL OR
EXTRACT(day FROM (MainEntry.start_date - PrevEntry.end_date)) > 1) StartDates
INNER JOIN
(SELECT
MainEntry.end_date,
MainEntry.row_number
FROM
mytable MainEntry
LEFT OUTER JOIN mytable NextEntry ON NextEntry.row_number + 1 = MainEntry.row_number
WHERE
NextEntry.start_date IS NULL OR
EXTRACT(day FROM (NextEntry.start_date - MainEntry.end_date)) > 1) EndDates
ON StartDates.row_number <= EndDates.row_number
GROUP BY
StartDates.start_date
请注意,GROUP BY
如果利用了索引,则可能包含StartDates.row_number
。另请注意,此ANSI解决方案最初错过了没有任何对的行的边缘情况(子查询中有INNER JOIN
s)。