我的数据集太大/公式太复杂,无法一次运行biglm
,fastLm
,speedlm
或lm
。因此,我要将我的数据集分成较小的部分,并为每50,000行执行update
。
我正在使用的简化版本。用我自己的方式替换虹膜数据集。
library(speedglm)
chunk1 <- iris[1:10,]
chunk2 <- iris[11:20,]
chunk3 <- iris[21:30,]
lmfit <- speedlm(Sepal.Length ~ Sepal.Width + Species, chunk1)
for (i in list(11,20, 21:30)){
lmfit2 <- updateWithMoreData(lmfit, iris[i,])
}
lmfit2
拆分模型会出现以下错误:
Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) :
contrasts can be applied only to factors with 2 or more levels
我有什么选择?