如何在lme4中确定何时以及如何在线性混合效应模型中包含协变量

时间:2018-04-20 10:21:04

标签: r lme4 multilevel-analysis

我在R中运行线性混合效果模型,我不确定如何在模型中包含一个不感兴趣的协变量,甚至不知道如何决定是否应该这样做。

我有两个主题内变量,让我们称它们为A和B,每个变量有两个级别,每个参与者都有很多观察结果。我对他们的互动如何在4组中发生变化感兴趣。我的结果是反应时间。在最简单的层面上,我有这个模型:

handleEditOptions = (item) => {
        var modal = (<VotingOptionModal resolutiondata = {item} />);
        ReactDOM.render(modal, document.getElementById('x-modal'));

    }

我想将性别添加为无关的协变量。我没有任何理论上的理由认为它会影响任何事情,但它实际上是不平衡的,所以我想把它包括在内。我的问题的第一部分是:最好的方法是什么?

是这个型号:

RT ~ 1 + A*B*Groups + (1+A | Subject ID)

或者这个:

RT ~ 1 + A*B*Groups + Gender + (1+A | Subject ID)

?或者其他一些方式?我对第二个模型的担忧是它在某种程度上不合理地夸大了模型中的术语数量。另外我担心过度拟合。

我的问题的第二部分:在选择最佳模型时,我应该何时添加协变量以查看它是否有任何区别?让我解释一下我的意思。

假设我从上面提到的最简单的模型开始,但没有A的斜率,所以这个:

RT ~ 1 + A*B*Groups*Gender + (1+A | Subject ID)

我应该首先添加协变量,作为主效应(+性别)或作为交互的一部分(*性别),然后然后看看为A添加斜率是否有所不同(通过使用anova()函数),或者我可以先添加斜率(理论上更重要),然后看看性别是否重要?

1 个答案:

答案 0 :(得分:1)

以下是关于你的两个问题的一些建议。

  1. 我建议使用迭代建模策略。

    开始
    RT ~ 1 + A*B*Groups*Gender + (1+A | Subject ID)
    

    并查看问题是否易于处理。以上模型将包括加法效果以及ABGroupsGender之间的所有互动术语。

    如果问题不易处理,请放弃Gender与其他协变量之间的互动条款,以及模型

    RT ~ 1 + A*B*Groups + Gender + (1+A | Subject ID)
    

    如果没有关于观察数量的任何细节,很难就潜在的过度拟合作出陈述。

  2. 关于你的第二个问题:一般来说,我会推荐贝叶斯方法;查看基于rstan的{​​{1}} R包,它允许您使用相同的brms / lme4公式语法,以便轻松翻译模型。模型比较和预测性能是非常广泛的术语。存在各种方式来探索和比较这些类型的嵌套/分层贝叶斯模型的预测性能。例如,请Piironi and VehtariVehtari and Ojanen查看论文。