我有一个包含146个协变量的数据集,我正在训练逻辑回归。
logit = glm(Y ~ .,
data = pred.dataset[1:1000,],
family = binomial)
该模型训练很快,但当我尝试用
查看Beta时logit
在第128个变量之后,Beta'全部" NA"
我在尝试将其导出为pmml时发现了这一点,并注意到它在128个预测变量后停止列出Beta。
我已经浏览了文档,无法找到最大数量的协变量,也接受了60k行的训练 - 我仍然在第128个预测变量后看到了NA。
这是glm的限制,还是我系统的限制?我正在运行R 3.1.2 64位。如何增加预测变量的数量?
答案 0 :(得分:1)
这是我实际上刚刚在Stack Exchange上提出的一个问题,这就是问题所在。看到这个链接: https://stats.stackexchange.com/questions/159316/logistic-regression-in-r-with-many-predictors?noredirect=1#comment303422_159316以及线程中包含的后续链接。虽然回答你的问题,但基本上逻辑回归的预测因子太多了,在这种情况下可以使用OLS,即使它没有产生二进制结果的最佳结果,结果仍然有效并且可以使用。