我有一个纵向测量和基本的人口统计变量年龄和性别,我想用lme建模测量。
在lme中建模固定效果部分时,我必须考虑哪些事项?我已经阅读了很多关于这个主题的问题和答案,但我不太确定要应用哪一个。
对于我的分析,为了对固定效果部分进行建模,首先我使用图形来检查响应和解释变量之间的关系(逐个)。我还使用了所有可能的选项来建模固定效果,并利用信息标准(AIC,BIC)来决定在所有这些选项中使用哪种模型。我利用了图形和信息cirtria值,并且我尝试了变量选择的单变量分析(例如t检验,卡方检验)以找到响应的潜在风险因素,但我不确定它是否属实应用单变量分析。
在应用所有这些方法之后,我决定仅使用固定效果部分中的主效果,因为该模型给出了最小的AIC和BIC,我也没有发现任何显示候选变量之间相互作用的图形趋势。是否可以仅包含主效应或不是逻辑?我真的不知道答案。因此,我们将非常感谢任何帮助。
提前致谢!
答案 0 :(得分:1)
这个问题有些困惑,实际上属于交叉验证。
但是。您似乎正在尝试建立模型,并比较不同的模型以得出最佳方案。一种简单的方法是提出所有可能的模型,然后从车包中运行Anova:
mod1<- lmer(response~Factor1*Factor2 + (1|Subject), df)
mod2<- lmer(response~Factor1+Factor2+ (1|Subject), df)
mod3<- lmer(response~Factor1:Factor2+ (1|Subject), df)
mod4<- lmer(response~Factor1:Factor2 + Factor1+ (1|Subject), df)
mod5<- lmer(response~Factor1:Factor2 + Factor2+ (1|Subject), df)
mod6<- lmer(response~Factor1+ (1|Subject), df)
mod7<- lmer(response~Factor2+ (1|Subject), df)
Anova(mod1, mod2, mod3, mod4, mod4,mod5,mod6,mod7)
但是请注意,上述操作存在问题。如果某个术语影响结果的可能性很高,那么您可能应该忽略它,无论它是否实际上是一个更好的模型。您需要考虑您对哪些变量/交互感兴趣,以及可以安全地说出哪些变量/交互很重要。然后,您可以从可接受的模型列表中进行选择。
作为一个例子:我有森林火灾前后的数据,控制地点未燃烧。所以我的模型看起来像这样: 反应〜处理*时间
对于某些响应变量,交互作用不显着。但是,我不会删除它,因为这种交互具有生物学意义,即使它并不重要。