R glm包中的最大协变量数是128?

时间:2015-06-30 17:53:11

标签: r glm

我有一个包含146个协变量的数据集,我正在训练逻辑回归。

logit = glm(Y ~ .,
        data = pred.dataset[1:1000,],
        family = binomial)

该模型训练很快,但当我尝试用

查看Beta时
logit

在第128个变量之后,Beta'全部" NA"

我在尝试将其导出为pmml时发现了这一点,并注意到它在128个预测变量后停止列出Beta。

我已经浏览了文档,无法找到最大数量的协变量,也接受了60k行的训练 - 我仍然在第128个预测变量后看到了NA。

这是glm的限制,还是我系统的限制?我正在运行R 3.1.2 64位。如何增加预测变量的数量?

1 个答案:

答案 0 :(得分:1)

这是我实际上刚刚在Stack Exchange上提出的一个问题,这就是问题所在。看到这个链接: https://stats.stackexchange.com/questions/159316/logistic-regression-in-r-with-many-predictors?noredirect=1#comment303422_159316以及线程中包含的后续链接。虽然回答你的问题,但基本上逻辑回归的预测因子太多了,在这种情况下可以使用OLS,即使它没有产生二进制结果的最佳结果,结果仍然有效并且可以使用。