我有一个数据集,我需要包含一些变量而不管统计相关性,但我想为其余变量运行一个分数选择(即最佳子集)。我想知道是否有一种方法可以指定分数选择方法,以保持每个模型中的特定变量。无论统计意义如何,我需要保留的变量以" kp _"
为前缀proc logistic work.data;
model y (event ='1')= kp_x1 kp_x2 x3 x4 x5 x6 x7 / selection=score best=3;
run;
答案 0 :(得分:1)
使用model语句中的 include = 选项将保留列出的第一个 n 变量。
使用您的代码,例如,要保留* kp_x1 *和* kp_x2 *变量,您可以写:
proc logistic work.data;
model y (event ='1')= kp_x1 kp_x2 x3 x4 x5 x6 x7 / selection=score best=3 include=2;
run;