您好我正在尝试使用标量值函数对大量数据进行算术运算。我的源数据采用以下格式:
----------
ID PriceDate Type Value
1 14/01/2018 Alpha 1.05
1 14/01/2018 Beta 1.07
2 14/01/2018 Alpha 1.03
2 14/01/2018 Beta 1.2
3 14/01/2018 Alpha 1.6
3 14/01/2018 Beta 1.5
1 15/01/2018 Alpha 1.24
1 15/01/2018 Beta 1.23
2 15/01/2018 Alpha 1.29
2 15/01/2018 Beta 1.1
3 15/01/2018 Alpha 1.16
3 15/01/2018 Beta 1.4
完整的数据集有7百万行+(1900个唯一ID和日期,从现在回到2011年)。 情况也是如此,数据集不完整,ID可能具有alpha值但在特定日期没有beta值,反之亦然或根本没有。
我正在尝试计算ID具有alpha值和beta值的每个日期的(alpha-beta)/ beta。
到目前为止,我有一个函数来为特定值执行此操作:
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE FUNCTION instrument.Calculate (@PriceDateF datetime, @ID bigint)
RETURNS decimal(20,10)
AS
-- Returns ((Alpha-Beta)/Beta)
BEGIN
Declare @BetaT decimal(20,10)
Declare @AlphaT decimal(20,10)
Declare @Result decimal (20,10)
SELECT @BetaT = Value
FROM ValueTable I
WHERE I.PriceDate = @PriceDateF
AND I.ID = @ID
AND Type = 'Beta'
SELECT @AlphaT = Value
FROM ValueTable I
WHERE I.PriceDate = @PriceDateF
AND I.ID = @ID
AND Type = 'Alpha'
SELECT @Result = (@AlphaT - @BetaT)/@BetaT
RETURN @Result
END
GO
我的问题是,我如何在'价值表'上随着时间的推移为每个个人ID运行此功能以获得结果,(a-b)/ b,每天为每个ID。我不确定如何输入参数以及函数是否应循环遍历数据表或任何其他方法来执行此操作。我也不确定如何处理数据中的差距(某些日期没有值,或只是beta或alpha值)。
非常感谢:) 我正在使用SQL Server Management Studio 2014
答案 0 :(得分:0)
在您的情况下,join
可能很简单:
select da.pricedate, da.id, da.value as alpha, db.value as beta,
(da.value - db.value) / db.value
from data da join
data db
on da.pricedate = db.pricedate and da.id = db.id and
da.type = 'Alpha' and
db.type = 'Beta';
不需要用户定义的功能。
我应该注意你也可以通过聚合来做到这一点:
select id, pricedate,
max(case when type = 'Alpha' then value end) as Alpha,
max(case when type = 'Beta' then value end) as Beta,
(max(case when type = 'Alpha' then value end) -
max(case when type = 'Beta' then value end)
) / max(case when type = 'Beta' then value end) as calculation
from data
group by id, pricedate;
再一次,用户定义的功能在这里没用。