如何在一段时间内为多个对象运行标量函数

时间:2018-01-15 12:49:33

标签: sql sql-server tsql user-defined-functions calculated-columns

您好我正在尝试使用标量值函数对大量数据进行算术运算。我的源数据采用以下格式:

----------
ID  PriceDate   Type    Value
1   14/01/2018  Alpha   1.05
1   14/01/2018  Beta    1.07
2   14/01/2018  Alpha   1.03
2   14/01/2018  Beta    1.2
3   14/01/2018  Alpha   1.6
3   14/01/2018  Beta    1.5
1   15/01/2018  Alpha   1.24
1   15/01/2018  Beta    1.23
2   15/01/2018  Alpha   1.29
2   15/01/2018  Beta    1.1
3   15/01/2018  Alpha   1.16
3   15/01/2018  Beta    1.4

完整的数据集有7百万行+(1900个唯一ID和日期,从现在回到2011年)。 情况也是如此,数据集不完整,ID可能具有alpha值但在特定日期没有beta值,反之亦然或根本没有。

我正在尝试计算ID具有alpha值和beta值的每个日期的(alpha-beta)/ beta。

到目前为止,我有一个函数来为特定值执行此操作:

SET ANSI_NULLS ON
GO

SET QUOTED_IDENTIFIER ON
GO

CREATE FUNCTION instrument.Calculate (@PriceDateF datetime, @ID bigint)
RETURNS decimal(20,10)
AS
-- Returns ((Alpha-Beta)/Beta)
BEGIN

    Declare @BetaT decimal(20,10)
    Declare @AlphaT decimal(20,10)
    Declare @Result decimal (20,10)

    SELECT @BetaT = Value
    FROM ValueTable I
    WHERE I.PriceDate = @PriceDateF
    AND I.ID = @ID
    AND Type = 'Beta'

    SELECT @AlphaT = Value
    FROM ValueTable I
    WHERE I.PriceDate = @PriceDateF
    AND I.ID = @ID
    AND Type = 'Alpha'

    SELECT @Result = (@AlphaT - @BetaT)/@BetaT

RETURN @Result

END
GO

我的问题是,我如何在'价值表'上随着时间的推移为每个个人ID运行此功能以获得结果,(a-b)/ b,每天为每个ID。我不确定如何输入参数以及函数是否应循环遍历数据表或任何其他方法来执行此操作。我也不确定如何处理数据中的差距(某些日期没有值,或只是beta或alpha值)。

非常感谢:) 我正在使用SQL Server Management Studio 2014

1 个答案:

答案 0 :(得分:0)

在您的情况下,join可能很简单:

select da.pricedate, da.id, da.value as alpha, db.value as beta,
       (da.value - db.value) / db.value
from data da join
     data db
     on da.pricedate = db.pricedate and da.id = db.id and
        da.type = 'Alpha' and
        db.type = 'Beta';

不需要用户定义的功能。

我应该注意你也可以通过聚合来做到这一点:

select id, pricedate,
       max(case when type = 'Alpha' then value end) as Alpha,
       max(case when type = 'Beta' then value end) as Beta,
       (max(case when type = 'Alpha' then value end) -
        max(case when type = 'Beta' then value end)
       ) / max(case when type = 'Beta' then value end) as calculation
from data
group by id, pricedate;

再一次,用户定义的功能在这里没用。