如何根据T-SQL中前几个月的数据确定缺失月份的值

时间:2009-04-30 18:20:53

标签: sql sql-server tsql gaps-and-islands

我在特定时间点发生了一系列交易:

CREATE TABLE Transactions (
    TransactionDate Date NOT NULL,
    TransactionValue Integer NOT NULL
)

数据可能是:

INSERT INTO Transactions (TransactionDate, TransactionValue)
VALUES ('1/1/2009', 1)
INSERT INTO Transactions (TransactionDate, TransactionValue)
VALUES ('3/1/2009', 2)
INSERT INTO Transactions (TransactionDate, TransactionValue)
VALUES ('6/1/2009', 3)

假设TransactionValue设置了某种级别,我需要知道事务之间的级别。我需要在一组T-SQL查询的上下文中,所以如果我能得到这样的结果集最好:

Month   Value
1/2009  1
2/2009  1
3/2009  2
4/2009  2
5/2009  2
6/2009  3

请注意,对于每个月,我们要么获取交易中指定的值,要么获取最新的非空值。

我的问题是我不知道该怎么做!我只是一个“中级”SQL开发人员,我不记得曾经见过这样的事情。当然,我可以在程序中创建我想要的数据,或者使用游标,但我想知道是否有更好的,面向集合的方法来执行此操作。

我正在使用SQL Server 2008,所以如果任何新功能都有帮助,我想听听它。

P.S。如果有人能想出一个更好的方式来陈述这个问题,甚至是更好的主题,我会非常感激。我花了很长时间才决定“传播”,而跛脚,是我能想到的最好的。 “涂片”听起来更糟。

7 个答案:

答案 0 :(得分:4)

我首先构建一个Numbers表,其中包含从1到100万左右的连续整数。一旦掌握了它,它们就会变得非常方便。

例如,以下是如何获得2008年每月的第1天:

select firstOfMonth = dateadd( month, n - 1, '1/1/2008')
from Numbers
where n <= 12;

现在,您可以使用OUTER APPLY将它们放在一起,以查找每个日期的最新事务,如下所示:

with Dates as (
    select firstOfMonth = dateadd( month, n - 1, '1/1/2008')
    from Numbers
    where n <= 12
)
select d.firstOfMonth, t.TransactionValue
from Dates d
outer apply (
    select top 1 TransactionValue
    from Transactions
    where TransactionDate <= d.firstOfMonth
    order by TransactionDate desc
) t;

这可以为您提供所需的内容,但您可能需要谷歌一点点找到创建Numbers表的最佳方法。

答案 1 :(得分:1)

我无法通过手机访问BOL,所以这是一个粗略的指南...

首先,您需要为没有数据的月份生成缺失的行。您可以使用OUTER连接到具有所需时间长度的固定表或临时表,也可以使用以编程方式创建的数据集(存储过程等)

其次,你应该看看新的SQL 2008'分析'函数,比如MAX(value)OVER(partition子句)来获取前一个值。

(我知道Oracle可以做到这一点,因为我需要它来计算交易日期之间的复合利息计算 - 实际上是同样的问题)

希望这能指出你正确的方向......

(避免把它扔到临时表中并对其进行诅咒。太粗糙!!!)

答案 2 :(得分:1)

这就是我想出的

declare @Transactions table (TransactionDate datetime, TransactionValue int)

declare @MinDate datetime
declare @MaxDate datetime
declare @iDate datetime
declare @Month int
declare @count int
declare @i int
declare @PrevLvl int

insert into @Transactions (TransactionDate, TransactionValue)
select '1/1/09',1

insert into @Transactions (TransactionDate, TransactionValue)
select '3/1/09',2

insert into @Transactions (TransactionDate, TransactionValue)
select '5/1/09',3


select @MinDate = min(TransactionDate) from @Transactions
select @MaxDate = max(TransactionDate) from @Transactions

set @count=datediff(mm,@MinDate,@MaxDate)
set @i=1
set @iDate=@MinDate


while (@i<=@count)
begin

    set @iDate=dateadd(mm,1,@iDate)

    if (select count(*) from @Transactions where TransactionDate=@iDate) < 1
    begin

        select @PrevLvl = TransactionValue from @Transactions where TransactionDate=dateadd(mm,-1,@iDate)

        insert into @Transactions (TransactionDate, TransactionValue)
        select @iDate, @prevLvl

    end


    set @i=@i+1
end

select *
from @Transactions
order by TransactionDate

答案 3 :(得分:1)

要以基于集合的方式执行此操作,您需要设置所有数据或信息。在这种情况下,有一个被忽视的数据“有几个月?”将“Calendar”表和数据库中的“Number”表作为实用程序表非常有用。

以下是使用这些方法之一的解决方案。第一段代码设置您的日历表。您可以使用光标或手动或其他任何方式填写它,您可以将其限制为您的业务所需的任何日期范围(回到1900-01-01或者回到1970-01-01,以及将来和您一样)想)。您还可以添加对您的业务有用的任何其他列。

CREATE TABLE dbo.Calendar
(
     date           DATETIME     NOT NULL,
     is_holiday     BIT          NOT NULL,
     CONSTRAINT PK_Calendar PRIMARY KEY CLUSTERED (date)
)

INSERT INTO dbo.Calendar (date, is_holiday) VALUES ('2009-01-01', 1)  -- New Year
INSERT INTO dbo.Calendar (date, is_holiday) VALUES ('2009-01-02', 1)
...

现在,使用此表格,您的问题变得微不足道了:

SELECT
     CAST(MONTH(date) AS VARCHAR) + '/' + CAST(YEAR(date) AS VARCHAR) AS [Month],
     T1.TransactionValue AS [Value]
FROM
     dbo.Calendar C
LEFT OUTER JOIN dbo.Transactions T1 ON
     T1.TransactionDate <= C.date
LEFT OUTER JOIN dbo.Transactions T2 ON
     T2.TransactionDate > T1.TransactionDate AND
     T2.TransactionDate <= C.date
WHERE
     DAY(C.date) = 1 AND
     T2.TransactionDate IS NULL AND
     C.date BETWEEN '2009-01-01' AND '2009-12-31'  -- You can use whatever range you want

答案 4 :(得分:1)

John Gibb发布了一个很好的答案,已经被接受,但我想稍微扩展一下:

  • 消除一年限制,
  • 更多地展示日期范围 明确的方式,和
  • 消除了单独的需要 数字表。

这种轻微的变化使用recursive common table expression来建立日期集,表示在DateRange中定义的日期之后或之后的每个月的第一个日期。注意使用MAXRECURSION选项来防止堆栈溢出(!);根据需要进行调整,以适应预期的最大月数。另外,请考虑添加替代日期装配逻辑以支持周,季度甚至是日常工作。

with 
DateRange(FromDate, ToDate) as (
  select 
    Cast('11/1/2008' as DateTime), 
    Cast('2/15/2010' as DateTime)
),
Dates(Date) as (
  select 
    Case Day(FromDate) 
      When 1 Then FromDate
      Else DateAdd(month, 1, DateAdd(month, ((Year(FromDate)-1900)*12)+Month(FromDate)-1, 0))
    End
  from DateRange
  union all
  select DateAdd(month, 1, Date)
  from Dates
  where Date < (select ToDate from DateRange)
)
select 
  d.Date, t.TransactionValue
from Dates d
outer apply (
  select top 1 TransactionValue
  from Transactions
  where TransactionDate <= d.Date
  order by TransactionDate desc
) t
option (maxrecursion 120);

答案 5 :(得分:1)

如果经常进行这种类型的分析,您可能会对我为此目的整理的SQL Server函数感兴趣:

if exists (select * from dbo.sysobjects where name = 'fn_daterange') drop function fn_daterange;
go

create function fn_daterange
   (
   @MinDate as datetime,
   @MaxDate as datetime,
   @intval  as datetime
   )
returns table
--**************************************************************************
-- Procedure: fn_daterange()
--    Author: Ron Savage
--      Date: 12/16/2008
--
-- Description:
-- This function takes a starting and ending date and an interval, then
-- returns a table of all the dates in that range at the specified interval.
--
-- Change History:
-- Date        Init. Description
-- 12/16/2008  RS    Created.
-- **************************************************************************
as
return
   WITH times (startdate, enddate, intervl) AS
      (
      SELECT @MinDate as startdate, @MinDate + @intval - .0000001 as enddate, @intval as intervl
         UNION ALL
      SELECT startdate + intervl as startdate, enddate + intervl as enddate, intervl as intervl
      FROM times
      WHERE startdate + intervl <= @MaxDate
      )
   select startdate, enddate from times;

go

这是question的答案,它也有一些样本输出。

答案 6 :(得分:0)

-----替代方式------

select 
    d.firstOfMonth,
    MONTH(d.firstOfMonth) as Mon,
    YEAR(d.firstOfMonth) as Yr, 
    t.TransactionValue
from (
    select 
        dateadd( month, inMonths - 1, '1/1/2009') as firstOfMonth 
        from (
            values (1), (2), (3), (4), (5), (7), (8), (9), (10), (11), (12)
        ) Dates(inMonths)
) d
outer apply (
    select top 1 TransactionValue
    from Transactions
    where TransactionDate <= d.firstOfMonth
    order by TransactionDate desc
) t