我有一个超级简单的数据集,只有3列 第一列是id,它是一个重复的6位数字 第二列是白天,是14天内的天数(有些日子不见了) 第三列是视图,它是某一天从某个ID收集的视图数量。
我想知道是否有办法对每个id进行回归?
谢谢!
答案 0 :(得分:0)
这是一个快速的玩具示例,将lapply应用于虹膜数据集并估算因子变量的每个级别的不同回归。
results <- lapply(levels(iris$Species), function(id)
lm(Sepal.Length ~ Sepal.Width, iris[iris$Species == id, ]))
names(results) <- levels(iris$Species)
summary(results[["virginica"]])
上面推荐的by方法更简洁
results2 <- by(iris, iris$Species,
function(x) lm(Sepal.Length ~ Sepal.Width, data = x))
summary(results2[["virginica"]])