我目前正在研究一个数据集,该数据集包含100个4个预测变量的值以及100个二进制结果的值(取值0和1)。
我对逻辑回归有非常基本的了解,我也非常感谢MATLAB的代码框架,它可以帮助解决上述问题。
我已经尝试过在MATLAB中使用glmfit和stepwiseglm等功能。
X = ([Predictor_input(:,1:5)]); % 5 Predictors
Y = ([Binary_outcome(:,1)]); % Binary outcome
% Using glmfit getting only one model outcome:
% Determination of model coefficients and stats:
[b, dev, stats] = glmfit(X,Y,'binomial','link','logit'); %none
[PHat, LowerCIWidth, UpperCIWidth] = glmval(b,X,'logit',stats);
% Using stepviseglm:
stepwiseglm(X,Y,'constant','upper','linear','distr','binomial','Criterion','aic','Verbose',2)
我希望使用stepwiseglm
来尝试不同的预测变量组合并输出最佳组合,但似乎可以单独评估(并非所有组合)。