我有一个包含许多不同变量分组的数据集。我也有一个测试集可能或者可能没有所有相同的组。
我想要做的是对列车集的每个子集/组,运行回归,然后将其应用到测试集中的相应匹配组。
我试图在Plyr开始这样做,但这个包对我来说有点混乱。
library(plyr)
data = mtcars # use this as easy example
my_regressions = plyr::dlply(mtcars, plyr::.(vs,am),lm,formula= mpg ~ wt+cyl)
如果我有另一个数据集,我如何将PREDICT功能应用于相应的组?我试图在DPlyr中找到这个,这是首选,但我不能。有什么帮助吗?:(
答案 0 :(得分:1)
可能将lapply
与predict
一起使用,如下所示:
lapply(
dlply(mtcars, .(vs,am), lm, formula = "mpg ~ wt+cyl"),
predict)