为了识别数据集中的重要变量,我开始为每个变量制作一个单变量逻辑回归模型。但是,对于某些分类变量,某些类别中只有少数观测值(观测总数为1155;没有缺失值)。运行代码
modelspec1='Y ~ X';
B1 = fitglm(table,modelspec1,'Distribution','binomial');
返回错误
Warning: Iteration limit reached.
In glmfit (line 324)
In GeneralizedLinearModel/fitter (line 575)
In classreg.regr.FitObject/doFit (line 94)
In GeneralizedLinearModel.fit (line 882)
In fitglm (line 142)
并且beta的估计变为大约100,具有巨大的标准误差且p值接近1.我试图使用
来增加迭代次数opts = statset('glmfit');
opts.MaxIter = 10000; % default value for glmfit is 100.
但它没有帮助。我真的需要得到某种估计(只是放弃一个类别,遗憾的是不是一个选项)。我该如何解决这个问题?