我有三个感兴趣的结果,每个结果在多个场合(干预之前,期间和之后)进行测量。考虑到我的数据结构(并且由于我不一定对随机效应感兴趣),我试图将聚类稳健的方法应用于多元回归。我的代码如下所示:
library(estimatr)
y <- cbind(a, b, c)
lm.robust <- lm_robust(y~factor(Timepoint), clusters = ID, data = outcome.data)
summary(lm.robust)
正如预期的那样,当我运行此代码时,摘要将单独分解每个结果变量。根据过去使用lm()进行多变量模型的经验,我希望输出的这一部分与运行三个独立的模型相同,每个模型都将变量“ a”,“ b”和“ c”作为因变量。但是,对于第一个变量以外的每个结果变量,多元模型都会计算一个估计值,一个标准误差和一个值,但是返回NA代替p值和置信区间以及它的r平方值收益高得离谱(例如,调整后的r2 = 0.97)。无论我的因变量的顺序如何,这都是正确的(即,如果顺序是abc,则摘要返回a的正确系数,但不返回b或c;如果顺序是bca,则摘要返回b的正确系数,但是不是c或a)。
我试图理解为什么会这样。可能值得注意的是,我的结果变量中有相当多的缺失。非常感谢任何见识!