将glm与R中的大数据集结合使用-内存已耗尽

时间:2019-04-18 20:17:20

标签: r glm

我有一个大型数据集(> 600万行和12列),我想对其进行逻辑回归。数据帧的第一列名为Dep1,其值为0或1。其他列的名称为Var1,Var2,...,Var11,它们是我感兴趣的自变量。数据框中的某些列是类型因子,而另一些是num。我正在通过以下调用运行glm:

mylogit <- glm(Dep1 ~ Var1 + Var2 + Var3 + Var4 + Var5 + Var6  + Var7 + Var8 + Var9 + Var10 + Var11,data=dataset,family=binomial())

当我使用所有变量调用glm时,我得到消息:

Error: vector memory exhausted (limit reached?)

我可以使用较小的变量集(例如,仅从Var1到Var4)运行glm,但是我想对所有变量进行检查。有任何解决此错误的建议吗?

1 个答案:

答案 0 :(得分:0)

我最终按照步骤here进行操作,并且在重新启动R后似乎已经解决了我的问题。