我想在data.table
内进行回归。 formula
需要动态构建。我尝试了以下方法:
x = data.table(a=1:20, b=20:1, id=1:5)
> x[,as.list(coef(lm(as.formula("a ~ b")))),by=id]
Error in eval(expr, envir, enclos) : object 'a' not found
如何将环境指定为评估发生的实际data.table的环境?
编辑:我意识到我可以做lm(a~b)。我需要公式是动态的,所以它被构建为一个字符串。动态地,我的意思是公式可以是paste0(var_1, "~", var_2)
,其中var_1 = a
和var_2 = b
以下是一个解决方案,我认为我们可以做得更好:
txt = parse(text="as.list(coef(lm(a ~ b)))")
> x[,eval(txt),by=id]
id (Intercept) b
1: 1 21 -1
2: 2 21 -1
3: 3 21 -1
4: 4 21 -1
5: 5 21 -1
答案 0 :(得分:16)
lm
可以接受一个字符串作为公式,因此将其与.SD
结合使用,如下所示:
> x[, as.list(coef(lm("a ~ b", .SD))), by = id]
id (Intercept) b
1: 1 21 -1
2: 2 21 -1
3: 3 21 -1
4: 4 21 -1
5: 5 21 -1