我有一个大型数据集(> 600万行和12列),我想对其进行逻辑回归。数据帧的第一列名为Dep1,其值为0或1。其他列的名称为Var1,Var2,...,Var11,它们是我感兴趣的自变量。数据框中的某些列是类型因子,而另一些是num。我正在通过以下调用运行glm:
mylogit <- glm(Dep1 ~ Var1 + Var2 + Var3 + Var4 + Var5 + Var6 + Var7 + Var8 + Var9 + Var10 + Var11,data=dataset,family=binomial())
当我使用所有变量调用glm时,我得到消息:
Error: vector memory exhausted (limit reached?)
我可以使用较小的变量集(例如,仅从Var1到Var4)运行glm,但是我想对所有变量进行检查。有任何解决此错误的建议吗?