嵌套随机效应和相关的固定效应

时间:2019-01-30 09:21:09

标签: r lme4 mixed-models nlme multilevel-analysis

我有跨国的专家组数据,我想知道IV对二元学生水平结局DV的影响

我想提供一个嵌套的随机效应,其中要考虑到学生所在的学校将影响学习成绩,并且各个国家的学校之间存在显着不同:(1|country/school)。因此,我开始使用的模型是:

model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')

我还想考虑时间趋势。起初我以为我应该按年固定收益,但是这些国家的政治发展随时间变化很大,我想捕捉一下,尽管1991年可能会使A国的学校陷入动荡,但1991年对于教育经费来说可能是伟大的一年因此,我认为我应该包括一个国家/地区年固定影响,如下所示:

model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
                data=data, family = 'binomial')

模型的随机效应是:

Random effects:
 Groups          Name        Variance  Std.Dev. 
 school:country (Intercept) 5.703e-02 2.388e-01
 country         (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups:  school:country, 51; country, 22

当模型中已经包含国家随机效应时,包括国家年份固定效应是否不正确?

提出问题的另一种方法: schoolcountry的子集,而country_yearcountry的子集,但school或{{ 1}}是彼此的子集吗?

1 个答案:

答案 0 :(得分:1)

据我所知,您有22个国家/地区。目前尚不清楚country_year是什么,但是假设它只是country:year的虚拟对象,那么将其作为固定效果(作为一个因素)可能不是一个好主意,因为将有太多的层次无法有效地解释。

由于您对时间趋势感兴趣,因此可以将year作为固定效果包括在内:

DV ~ IV + (1|country/school) + as.factor(year)

如果有很多years,您可能会发现最好将年份包括为数字

DV ~ IV + (1|country/school) + as.numeric(year)

..因为这将估计年份的单个(线性)趋势,但是如果有一个因素,它将计算估计值,无论存在多少年(负1),当存在多个年份时,将不容易解释许多层次。但是,当将其编码为因子时,估计值可以指示是否存在非线性趋势,然后可以切换到as.numeric并引入非线性项。

OP的最后一段有些混乱。如果country_year确实嵌套在country内,那么我们将:

DV ~ IV + (1|country/school) + (1|country:country_year)

..与...相同:

DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)

...但是,这不会估计任何时间趋势。如果您想估算趋势,则需要将year(或country_year)作为上述固定效应包括在内-您可以可以允许这在学校之间有所不同(和/或国家/地区),将其作为随机斜率包括在内,例如:

DV ~ IV + year + (1|country) + (year|school:country)