使用“科学相关”变量在SAS中运行分数选择

时间:2014-03-23 01:39:24

标签: sas logistic-regression

我有一个数据集,我需要包含一些变量而不管统计相关性,但我想为其余变量运行一个分数选择(即最佳子集)。我想知道是否有一种方法可以指定分数选择方法,以保持每个模型中的特定变量。无论统计意义如何,我需要保留的变量以" kp _"

为前缀
proc logistic work.data;
    model y (event ='1')= kp_x1 kp_x2 x3 x4 x5 x6 x7 / selection=score best=3;
run;

1 个答案:

答案 0 :(得分:1)

使用model语句中的 include = 选项将保留列出的第一个 n 变量。

使用您的代码,例如,要保留* kp_x1 *和* kp_x2 *变量,您可以写:

proc logistic work.data;
  model y (event ='1')= kp_x1 kp_x2 x3 x4 x5 x6 x7 / selection=score best=3 include=2;
run;