将AR(1)术语添加到R

时间:2018-03-01 20:29:20

标签: r linear-regression lapply lm autoregressive-models

我正在运行503个单独的回归,每个回归都有一个单独的因变量,有3个独立变量和1个AR(1)项。

数据:

# fake data 
set.seed(333)
df <- data.frame(seq(as.Date("2017/1/1"), as.Date("2017/2/19"), "days"),
                 matrix(runif(50*506), nrow = 50, ncol = 506))

names(df) <- c("Date", paste0("var", 1:503), c("mktrf", "smb", "hml"))

我使用名为lagpad的函数创建AR(1)过程:

lagpad <- function(x, k=1) {
  i<-is.vector(x)
  if(is.vector(x)) x<-matrix(x) else x<-matrix(x,nrow(x))
  if(k>0) {
    x <- rbind(matrix(rep(NA, k*ncol(x)),ncol=ncol(x)), matrix(x[1:(nrow(x)-k),], ncol=ncol(x)))
  }
  else {
    x <- rbind(matrix(x[(-k+1):(nrow(x)),], ncol=ncol(x)),matrix(rep(NA, -k*ncol(x)),ncol=ncol(x)))
  }
  if(i) x[1:length(x)] else x
}

然后我存储了必要的变量变量:

  1. 所有dep var

    x = df[,505:507]
    
  2. 所有indep var

    y <- df[,2:504]
    
  3. AR(1)流程

    y_lag <- lagpad(y, -1)
    
  4. 适合所有模特

    list_models_AR= lapply(y, function(y) 
           with(x, lm(y ~ mktrf +  smb + hml + y_lag, na.action = na.exclude)))
    
  5. 在这种情况下,我无法弄清楚如何使用lapply,因为需要调用 y_lag 的多个组件,每个回归一个。

1 个答案:

答案 0 :(得分:1)

我不确定你的延迟期,它似乎实际上是下一个y列。如果是这样,您可以按如下方式创建502模型:

list_models_AR= lapply(1:(ncol(y)-1), function(i) lm(y[,i]~x[,1] +  x[,2] + x[,3] +y[,i+1], na.action=na.exclude))