Question

我有跨国的专家组数据，我想知道IV对二元学生水平结局DV的影响

我想提供一个嵌套的随机效应，其中要考虑到学生所在的学校将影响学习成绩，并且各个国家的学校之间存在显着不同：(1|country/school)。因此，我开始使用的模型是：

model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')

我还想考虑时间趋势。起初我以为我应该按年固定收益，但是这些国家的政治发展随时间变化很大，我想捕捉一下，尽管1991年可能会使A国的学校陷入动荡，但1991年对于教育经费来说可能是伟大的一年因此，我认为我应该包括一个国家/地区年固定影响，如下所示：

model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
                data=data, family = 'binomial')

模型的随机效应是：

Random effects:
 Groups          Name        Variance  Std.Dev. 
 school:country (Intercept) 5.703e-02 2.388e-01
 country         (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups:  school:country, 51; country, 22

当模型中已经包含国家随机效应时，包括国家年份固定效应是否不正确？

提出问题的另一种方法： school是country的子集，而country_year是country的子集，但school或{{ 1}}是彼此的子集吗？

Answer 1

据我所知，您有22个国家/地区。目前尚不清楚country_year是什么，但是假设它只是country:year的虚拟对象，那么将其作为固定效果（作为一个因素）可能不是一个好主意，因为将有太多的层次无法有效地解释。

由于您对时间趋势感兴趣，因此可以将year作为固定效果包括在内：

DV ~ IV + (1|country/school) + as.factor(year)

如果有很多years，您可能会发现最好将年份包括为数字

DV ~ IV + (1|country/school) + as.numeric(year)

..因为这将估计年份的单个（线性）趋势，但是如果有一个因素，它将计算估计值，无论存在多少年（负1），当存在多个年份时，将不容易解释许多层次。但是，当将其编码为因子时，估计值可以指示是否存在非线性趋势，然后可以切换到as.numeric并引入非线性项。

OP的最后一段有些混乱。如果country_year确实嵌套在country内，那么我们将：

DV ~ IV + (1|country/school) + (1|country:country_year)

..与...相同：

DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)

...但是，这不会估计任何时间趋势。如果您想估算趋势，则需要将year（或country_year）作为上述固定效应包括在内-您可以可以允许这在学校之间有所不同（和/或国家/地区），将其作为随机斜率包括在内，例如：

DV ~ IV + year + (1|country) + (year|school:country)

嵌套随机效应和相关的固定效应

1 个答案: