我有一个调查不同种族(黑人,白人和拉丁裔)抑郁症的数据集。
我想知道所有种族的基线抑郁症与岗后抑郁症有何关系
lm(depression_base ~ depression_post, data=Data
现在,我想按族裔来看这种关系。我的数据集中的种族编码为0 = White
,1 = Black
和2 = Latina
。我以为我需要使用ifelse
函数,但是似乎无法正常工作。这是我为White
尝试的内容:
lm(depression_base[ifelse, ethnicity == 0],
depression_post[ifelse, ethnicity == 0])
有什么建议吗?
答案 0 :(得分:2)
将您的ethnicity
编码为正确水平的因子,然后进行一次回归:
## recode your 0, 1, 2 from numeric to factor
Data$ethnicity <- factor(Data$ethnicity)
fit <- lm(depression_base ~ depression_post * ethnicity, data = Data)
单个模型可让您对组之间的变异性进行适当的测试。
您可能对系数的含义感到困惑。如果是这样,请查看this或CrossValidated上的其他帖子。