如何输入rollapplyr FUN

时间:2017-03-05 20:32:25

标签: r rollapply

假设我有以下数据:

input <- data.frame(id=rep(c('A', 'B'), c(10, 10)),year=rep(1:10, 2),
                  y=c(rnorm(10), rnorm(10)),x1 = c(rnorm(10),rnorm(10)))

我想使用rollapplyr进行滚动回归。首先我定义一个beta函数:

# Simple Regression
beta <- function(x, indepvar, depvar) {
  a <- coef(lm(formula = indepvar ~ depvar, data = x))
  return(a)
}

现在我想在rollapplyr设置中使用此功能。 (我知道我可以在rollapplyr中定义函数,但我想理解这个概念。)

rollapplyr(input, width = 6,
              FUN = beta, x = input, indepvar = y, depvar = x1,
              by.column = FALSE)

我试图通过在上面的代码中定义input,indepvar和depvar来提供beta函数的参数。但是我收到了这个错误:

  

FUN中的错误(数据[posns,],...):未使用的参数(数据[posns,])

这里有一个问题:unused arguments但我不明白我没有使用的论点。这个错误在我的上下文中意味着什么?我为什么得到它?

1 个答案:

答案 0 :(得分:1)

我认为这里有一些问题。让我带你走过最关键的一些:

# Simple Regression
beta <- function(x, indepvar, depvar) {
  a <- coef(lm(formula = indepvar ~ depvar, data = x))
  return(a)
}

您编写函数beta的方式意味着您必须输入数据xindepvar列和depvar列。但这不适用于lm,因为indepvardepvar 包含的内容被输入,而不是变量名称。例如,以下内容不起作用:

beta(input, y, x1)
  

eval(expr,envir,enclos)中的错误:找不到对象'y'

这是因为在y之外不存在x1input。您的rollapplyr也有同样的问题。解决这个问题的一种方法是写:

beta <- function(indepvar, depvar) {
  a <- coef(lm(indepvar ~ depvar))
  return(a)
}

并明确输入如下列:

# > beta(input[,3],input[,4])
# (Intercept)      depvar 
#   0.1308993   0.2373399

现在可行:

rollapplyr(input[3:4], width = 6,
           FUN = function(x) beta(x[,1], x[,2]),
           by.column = FALSE)

#      (Intercept)        depvar
# [1,] -0.04987909  0.6433585022
# [2,] -0.23739671  0.7527017129
# [3,] -0.40483456  0.5833452315
# [4,] -0.28191172  0.6660916836
# [5,]  0.02886934  0.5334114615
# [6,]  0.17284232  0.8126499211
# [7,]  0.01236415  0.3194661428
# [8,]  0.48156300 -0.1532216150
# [9,]  0.75965765 -0.1993015431
# [10,]  0.80509109 -0.1822009137
# [11,]  0.55055694 -0.0005880675
# [12,]  0.53963291 -0.0262970723
# [13,]  0.46509011  0.0570725348
# [14,]  0.33227459  0.1598345855
# [15,] -0.20316429  0.2757045612

如果您希望能够按名称调用列,可以将beta函数编写为:

library(zoo)
beta <- function(x, indepvar, depvar) {
  a <- coef(lm(as.formula(paste(indepvar, "~", depvar)), 
               data = x))
  return(a)
}

rollapplyr(input[3:4], width = 6,
           FUN = function(x) beta(as.data.frame(x), "y", "x1"),
           by.column = FALSE)

#      (Intercept)            x1
# [1,] -0.04987909  0.6433585022
# [2,] -0.23739671  0.7527017129
# [3,] -0.40483456  0.5833452315
# [4,] -0.28191172  0.6660916836
# [5,]  0.02886934  0.5334114615
# [6,]  0.17284232  0.8126499211
# [7,]  0.01236415  0.3194661428
# [8,]  0.48156300 -0.1532216150
# [9,]  0.75965765 -0.1993015431
# [10,]  0.80509109 -0.1822009137
# [11,]  0.55055694 -0.0005880675
# [12,]  0.53963291 -0.0262970723
# [13,]  0.46509011  0.0570725348
# [14,]  0.33227459  0.1598345855
# [15,] -0.20316429  0.2757045612

请注意,我必须向input[3:4]提供input而不仅仅是rollapplyr,因为显然rollapplyr仅将矩阵作为输入。如果input具有混合类型,rollapplyr会将其强制转换为字符矩阵,这是不可取的。因此,我必须同时提供仅限数字的列将其强制转换回data.frame,as.data.frame才能使lm正常工作。

以下是与rollapplyr讨论此问题的两个链接:

Is there a function like rollapply for data.frame

Can `ddply` (or similar) do a sliding window?