为什么当随机斜率和截距不相关时,预测变量的参考类别的选择很重要?

时间:2017-09-06 18:10:14

标签: r logistic-regression lme4 mixed-models

我最初在编辑前一个问题时问过这个问题,但我认为它应该有自己的问题。

我正在运行一个带有单个二分预测器(编码为1/0)的glmer。该模型还包括随机主题截距,以及随机项截距和斜率。

当随机截距和斜率不相关时,更改预测器的哪个级别作为参考类别不会更改系数的绝对值。

无论是将预测变量保留为数字变量,还是将预测变量转换为因子并使用以下代码,都会发生这种情况:

t1<-glmer(DV~IV+(1|PPT)+(0+dummy(IV, "1")|Item)+(1|Item), data = data, family = "binomial”)

这是真的结果吗?如果是这样,任何人都可以解释为什么不相关的随机拦截和斜率允许它出现?如果没有,我如何运行具有不相关的随机截距和斜率的模型,以防止参考类别的选择影响结果?

非常感谢!

编辑:

以下是一些示例数据。

对不起,我不确定如何使用r命令链接到它,但是csv数据的示例在这里:https://pastebin.com/embed_js/X2h9yT4c

testdata<-read.csv("test.csv")
testdata$PPT<-as.factor(testdata$PPT)
testdata$BalancedIV<-as.factor(testdata$BalancedIV)
testdata$BalancedIVReversed<-as.factor(testdata$BalancedIVReversed)
testdata$BIV<-as.numeric(as.character(testdata$BalancedIV))
testdata$BIVR<-as.numeric(as.character(testdata$BalancedIVReversed))
testdata$UIV<-as.numeric(as.character(testdata$UnBalancedIV))
testdata$UIVR<-as.numeric(as.character(testdata$UnbalancedIVReversed))

这两个模型具有相同的预测器但具有反向编码(即第一次为1/0,第二次为0/1)。您可以看到它们的系数具有不同的绝对值。

t19<-glmer(DV~BalancedIV+(1|PPT)+(0+dummy(BalancedIV, "1")|Item)+(1|Item), data = testdata, family = "binomial")
t20<-glmer(DV~BalancedIVReversed+(1|PPT)+(0+dummy(BalancedIVReversed, "1")|Item)+(1|Item), data = testdata, family = "binomial")

summary(t19)
summary(t20)

0 个答案:

没有答案