我正在对四值多项(分类)自变量进行二元因变量的逻辑回归。有人向我建议,最好将自变量放在多项式而不是三个二进制变量中,尽管SAS似乎将多项式视为三个二进制。其原因在于,如果给出多项式,SAS将报告三个二进制变量的std错误和置信区间相对于省略的变量'而如果给出三个二进制,它将报告它们相对对于变量为零的所有情况,
当我以两种方式进行回归并进行比较时,我发现几乎所有结果都是相同的,包括拟合统计,优势比估计和优势比的置信区间。但是两者之间的系数估计和配置间隔不同。
从我对Hosmer和Lemeshow的“应用逻辑回归”中提出的基础理论的解读,SAS报告的系数估计和配置间隔与理论相一致。使用三个二元自变量进行回归,但不使用四值多项式进行回归。
我认为差异可能与SAS的设计变量的选择有关,对于二元回归,值为0和1,而对于多项式,它们为-1但是我不太了解SAS在那里做了什么。
有人知道SAS的方法在两个回归之间有何不同,和/或可以解释输出的差异吗?
以下是SAS输出的链接: SAS output
以下是SAS代码:
proc logistic data=tab descending;
class binB binC binD / descending;
model y = binD binC binB ;
run;
proc logistic data=tab descending;
class multi / descending;
model y = multi;
run;