Question

我有一个数据集，我需要包含一些变量而不管统计相关性，但我想为其余变量运行一个分数选择（即最佳子集）。我想知道是否有一种方法可以指定分数选择方法，以保持每个模型中的特定变量。无论统计意义如何，我需要保留的变量以＆＃34; kp _＆＃34;

为前缀

proc logistic work.data;
    model y (event ='1')= kp_x1 kp_x2 x3 x4 x5 x6 x7 / selection=score best=3;
run;

Answer 1

使用model语句中的 include = 选项将保留列出的第一个 n 变量。

使用您的代码，例如，要保留* kp_x1 *和* kp_x2 *变量，您可以写：

proc logistic work.data;
  model y (event ='1')= kp_x1 kp_x2 x3 x4 x5 x6 x7 / selection=score best=3 include=2;
run;