我在SAS中运行简单的线性回归。回归有三组不同的参与者作为预测因子(第1组作为参考),结果是连续的社会支持变量,以及5个协变量。三个协变量是二分的(age
,sex
,& education
),一个是三级名义变量(marital status
),最后一个是连续的(它是chronic disease index
)。
我的问题是:我是否需要以某种方式在SAS编码中指定不同类型的协变量?
这个编码示例是否正确?:
proc glm data=work.example;
class group age sex education marital education chronic_diseases;
model social_support = group age sex education marital education chronic_diseases;
estimate 'group 1 vs group 2' group -1 1 0;
estimate 'group 1 vs group 3' group -1 0 1;
run;
答案 0 :(得分:0)
class
语句告诉SAS您要考虑非连续变量:即分类或二进制。除非您指定参考组,否则它不会区分两者,因为它将默认按升序选择基于第一个值的参考。
例如,如果您要比较Apples
和Oranges
,SAS会使用Apples
作为参考值。嘿,他们结果 - 你可以比较水果和水果! :)
除非在class
语句中指定,否则所有模型协变量都被视为数字。由于chronic_diseases
是连续的,只需将其从class
语句中删除即可;否则,SAS将查看chronic_diseases
的每个值,并将其视为一个级别,然后将它们全部与最低级别进行比较。
proc glm data=work.example;
class group age sex education marital education;
model social_support = group age sex education marital education chronic_diseases;
estimate 'group 1 vs group 2' group -1 1 0;
estimate 'group 1 vs group 3' group -1 0 1;
run;