我有跨国的专家组数据,我想知道IV
对二元学生水平结局DV
的影响
我想提供一个嵌套的随机效应,其中要考虑到学生所在的学校将影响学习成绩,并且各个国家的学校之间存在显着不同:(1|country/school)
。因此,我开始使用的模型是:
model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')
我还想考虑时间趋势。起初我以为我应该按年固定收益,但是这些国家的政治发展随时间变化很大,我想捕捉一下,尽管1991年可能会使A国的学校陷入动荡,但1991年对于教育经费来说可能是伟大的一年因此,我认为我应该包括一个国家/地区年固定影响,如下所示:
model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
data=data, family = 'binomial')
模型的随机效应是:
Random effects:
Groups Name Variance Std.Dev.
school:country (Intercept) 5.703e-02 2.388e-01
country (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups: school:country, 51; country, 22
当模型中已经包含国家随机效应时,包括国家年份固定效应是否不正确?
提出问题的另一种方法:
school
是country
的子集,而country_year
是country
的子集,但school
或{{ 1}}是彼此的子集吗?
答案 0 :(得分:1)
据我所知,您有22个国家/地区。目前尚不清楚country_year
是什么,但是假设它只是country:year
的虚拟对象,那么将其作为固定效果(作为一个因素)可能不是一个好主意,因为将有太多的层次无法有效地解释。
由于您对时间趋势感兴趣,因此可以将year
作为固定效果包括在内:
DV ~ IV + (1|country/school) + as.factor(year)
如果有很多years
,您可能会发现最好将年份包括为数字
DV ~ IV + (1|country/school) + as.numeric(year)
..因为这将估计年份的单个(线性)趋势,但是如果有一个因素,它将计算估计值,无论存在多少年(负1),当存在多个年份时,将不容易解释许多层次。但是,当将其编码为因子时,估计值可以指示是否存在非线性趋势,然后可以切换到as.numeric
并引入非线性项。
OP的最后一段有些混乱。如果country_year
确实嵌套在country
内,那么我们将:
DV ~ IV + (1|country/school) + (1|country:country_year)
..与...相同:
DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)
...但是,这不会估计任何时间趋势。如果您想估算趋势,则需要将year
(或country_year
)作为上述固定效应包括在内-您可以可以允许这在学校之间有所不同(和/或国家/地区),将其作为随机斜率包括在内,例如:
DV ~ IV + year + (1|country) + (year|school:country)