我试图比较两个模型,其中较小的模型是我假设的最佳模型,然后较大的模型是包含所有变量的完整模型。我想使用"测试语句"在proc logistic中比较模型以确定是否有任何其他变量可能具有重要意义。问题是测试似乎没有识别出我的分类变量(d),如下所示:
proc logistic data = test;
class d (param = ref ref = '0');
model y (event = '1') = a b c d;
test1: test c=d=0;
run;
This is the image of the error showing in the log
基本上我正在测试是否有可能c或d可能是模型中的重要预测因子。
另外,我不确定我是否正在使用"测试声明"正确的,所以对此的任何建议都将受到赞赏。
以下是您可以使用的测试数据:
data test (drop=i);
do i=1 to 1000;
a=round(uniform(1)*4,.01);
b=round(uniform(1)*10,.01);
c=round(uniform(1)*7.5,.01);
if b<2 then d=1;
else d=0;
if i<500 then y=1;
else y=0;
output;
end;
stop;
run;
答案 0 :(得分:2)
应按照OUTEST =数据集中参数名称一节中的说明指定Intercept和CLASS变量参数名称。
因此,根据您的代码,您可以将测试语句指定为:
test1: test c=d1=0;
您应该检查您的OUTEST数据集,以获取确切的名称。不幸的是,这确实意味着你两次运行proc,但这很容易。