回归分数差分计算的矢量化

时间:2016-03-31 05:14:05

标签: r for-loop vectorization

我正在努力加快这种回火分数差分的近似。 这可以控制时间序列的长/准长记忆。鉴于第一个for循环是迭代的,我不知道如何对它进行矢量化。此外,尝试的矢量化的输出与未改变的原始代码略有不同。谢谢你的帮助。

原始代码

tempfracdiff= function (x,d,eta) {

n=length(x);x=x-mean(x);PI=numeric(n)
PI[1]=-d;TPI=numeric(n);ydiff=x

for (k in 2:n) {PI[k]=PI[k-1]*(k-1-d)/k}
for (j in 1:n) {TPI[j]=exp(-eta*j)*PI[j]}
for (i in 2:n) {ydiff[i]=x[i]+sum(TPI[1:(i-1)]*x[(i-1):1])}
return(ydiff)                  }

尝试矢量化

tempfracdiffFL=function (x,d,eta) {

n=length(x);x=x-mean(x);PI=numeric(n)
PI[1]=-d;TPI=numeric(n);ydiff=x

for (k in 2:n) {PI[k]=PI[k-1]*(k-1-d)/k}
TPI[1:n]=exp(-eta*1:n)*PI[1:n]
ydiff[2:n]=x[2:n]+sum(TPI[1:(2:n-1)]*x[(2:n-1):1])
return(ydiff)          }

2 个答案:

答案 0 :(得分:2)

对于PI,您可以使用cumprod

k <- 1:n
PI <- cumprod((k-1-d)/k)

TPI可以在没有指数的情况下表达:

TPI <- exp(-eta*k)*PI

ydiffx加上xTPI的卷积:

ydiff <- x+c(0,convolve(x,rev(TPI),type="o")[1:n-1])

所以,把它们放在一起:

mytempfracdiff = function (x,d,eta) {
  n <- length(x)
  x <- x-mean(x)
  k <- 1:n
  PI <- cumprod((k-1-d)/k)
  TPI <- exp(-eta*k)*PI
  x+c(0,convolve(x,rev(TPI),type="o")[1:n-1])
}

测试用例示例

set.seed(1)
x <- rnorm(100)
d <- 0.1
eta <- 0.5

all.equal(mytempfracdiff(x,d,eta), tempfracdiff(x,d,eta))
# [1] TRUE

library(microbenchmark)
microbenchmark(mytempfracdiff(x,d,eta), tempfracdiff(x,d,eta))
    Unit: microseconds
                          expr     min       lq      mean   median       uq
     mytempfracdiff(x, d, eta) 186.220 198.0025  211.9254  207.473  219.944
       tempfracdiff(x, d, eta) 961.617 978.5710 1117.8803 1011.257 1061.816
          max neval
      302.548   100
     3556.270   100

答案 1 :(得分:1)

对于PI [k],Reduce是有帮助的

n <- 5; d <- .3
fun <- function( a,b ) a * (b-1-d)/b
Reduce( fun, c(1,1:n), accumulate = T )[-1] # Eliminates PI[0]

[1] -0.30000000 -0.10500000 -0.05950000 -0.04016250 -0.02972025