在R中的data.table环境中创建一个公式

时间:2013-02-09 01:39:49

标签: r environment data.table

我想在data.table内进行回归。 formula需要动态构建。我尝试了以下方法:

x = data.table(a=1:20, b=20:1, id=1:5)
> x[,as.list(coef(lm(as.formula("a ~ b")))),by=id]
  Error in eval(expr, envir, enclos) : object 'a' not found

如何将环境指定为评估发生的实际data.table的环境?

编辑:我意识到我可以做lm(a~b)。我需要公式是动态的,所以它被构建为一个字符串。动态地,我的意思是公式可以是paste0(var_1, "~", var_2),其中var_1 = avar_2 = b

以下是一个解决方案,我认为我们可以做得更好:

txt = parse(text="as.list(coef(lm(a ~ b)))")
> x[,eval(txt),by=id]
  id (Intercept)  b
  1:  1          21 -1
  2:  2          21 -1
  3:  3          21 -1
  4:  4          21 -1
  5:  5          21 -1

1 个答案:

答案 0 :(得分:16)

lm可以接受一个字符串作为公式,因此将其与.SD结合使用,如下所示:

> x[, as.list(coef(lm("a ~ b", .SD))), by = id]
   id (Intercept)  b
1:  1          21 -1
2:  2          21 -1
3:  3          21 -1
4:  4          21 -1
5:  5          21 -1