谁能帮我理解在多元线性回归模型中使用星号和加号的区别?如果我想适合这个模型
model<-lm(continuous variable ~ Covariate SEX+ Covariate RACE+ Factor gene* Factor SNP,
data= mydata)
同时使用加号和星号是否正确?我有兴趣研究因子基因和因子 SNP 对连续变量的影响,并且我在本研究中将性别和种族作为协变量进行控制。
另外,我还有一个问题,如果我拟合了将近 100 个模型,我是否应该检查我拟合的每个模型的模型假设?
答案 0 :(得分:0)
*
用于穿越,(即,y~a*b
等价于 y~a+b+a:b
)
continuous variable ~ Covariate SEX+ Covariate RACE+ Factor gene* Factor SNP
因此等价于
continuous variable ~ Covariate SEX+ Covariate RACE+ Factor gene + Factor SNP + Factor gene:Factor SNP
你所做的一切都很好。