SQL - 选择下一个日期查询

时间:2010-08-31 13:54:48

标签: sql

我有一张表,其中包含许多ID和许多与每个ID相关联的日期,甚至还有一些没有日期的ID。对于每个ID和日期组合,我想选择与同一ID相关联的ID,日期和下一个最大日期,如果不存在,则选择null作为下一个日期。

样本表:

ID      Date
1       5/1/10
1       6/1/10
1       7/1/10
2       6/15/10
3       8/15/10
3       8/15/10
4       4/1/10
4       4/15/10
4       

期望的输出:

ID       Date       Next_Date
1        5/1/10     6/1/10
1        6/1/10     7/1/10
1        7/1/10     
2        6/15/10    
3        8/15/10    
3        8/15/10    
4        4/1/10     4/15/10
4        4/15/10    

3 个答案:

答案 0 :(得分:15)

SELECT
    mytable.id,
    mytable.date,
    (
        SELECT
            MIN(mytablemin.date)
        FROM mytable AS mytablemin
        WHERE mytablemin.date > mytable.date
            AND mytable.id = mytablemin.id
    ) AS NextDate
FROM mytable

这已在SQL Server 2008 R2上测试过(但它应该适用于其他DBMS)并产生以下输出:

id          date                    NextDate
----------- ----------------------- -----------------------
1           2010-05-01 00:00:00.000 2010-06-01 00:00:00.000
1           2010-06-01 00:00:00.000 2010-06-15 00:00:00.000
1           2010-07-01 00:00:00.000 2010-08-15 00:00:00.000
2           2010-06-15 00:00:00.000 2010-07-01 00:00:00.000
3           2010-08-15 00:00:00.000 NULL
3           2010-08-15 00:00:00.000 NULL
4           2010-04-01 00:00:00.000 2010-04-15 00:00:00.000
4           2010-04-15 00:00:00.000 2010-05-01 00:00:00.000
4           NULL                    NULL

更新1: 对于那些感兴趣的人,我比较了SQL Server 2008 R2中两个变体的性能(一个使用MIN聚合,另一个使用TOP 1和ORDER BY):

如果日期列没有索引,则MIN版本的成本为0.0187916,TOP / ORDER BY版本的成本为0.115073,因此MIN版本“更好”。

使用日期列上的索引,它们的执行方式相同。

请注意,这仅仅测试了这9条记录,因此结果可能(非常)虚假......

更新2: 结果适用于10,000个均匀分布的随机记录。 TOP / ORDER BY查询需要很长时间才能运行100,000条记录,我必须取消它并放弃。

答案 1 :(得分:1)

SELECT id, date, ( SELECT date FROM table t1 WHERE t1.date > t2.date ORDER BY t1.date LIMIT 1 ) FROM table t2

答案 2 :(得分:1)

如果您的数据库是oracle,则可以使用lead() and lag()函数。

SELECT id, date, 
LEAD(date, 1, 0) OVER (PARTITION BY ID ORDER BY Date DESC NULLS LAST) NEXT_DATE,
FROM Your_table
ORDER BY ID;