近零差异变量

时间:2018-04-14 19:27:59

标签: r logistic-regression

我正在使用MNIST数据集(http://yann.lecun.com/exdb/mnist/)的子集。任务是使用解释变量预测数字,这些变量是从像素1到像素255(RGB标度),我教过的两种方法是逻辑回归和线性判别分析用于分类问题。

但是,当我运行logistic回归命令时,收到以下错误消息:

glm.fit: algorithm did not convergeglm.fit: fitted probabilities numerically 0 or 1 occurred

当我运行lda命令时,收到以下错误消息:

Error in lda.default(x, grouping, ...) : variables 11 12 27 28 29 30 31 124 125 420 549 597 appear to be constant within groups

我已经完成了一些谷歌搜索,结果似乎表明这与ro“接近零方差”预测变量(https://www.r-bloggers.com/near-zero-variance-predictors-should-we-remove-them/)有关(考虑到数据的外观,这是有意义的)。

但是,当我使用nearZeroVar包中的caret函数时,所有x变量都被归类为“接近零方差”。有没有办法解决这个问题,以便我可以运行逻辑和LDA模型?

0 个答案:

没有答案