我已经有一段时间没遇到问题了,我似乎无法弄清楚如何解决它。
介绍: 我正在进行回归研究,根据几个生态学参数(如菌落大小,工人和女王近亲繁殖,在模型中表示为HL_Q和HL_Colony),我预测了在蚁群中产生的性巢比例。响应变量是性蛹和工蛹的数量。
m_sexual_binom = glmer(cbind(Sexualpupae, Workers)~ scale(HL_Q) + scale(HL_Colony) + scale(Colony_size) +
Island + (1|Colony), data = mergeddata, family = "binomial")
正如您所看到的,我已经缩放了所有数字变量。我想第一个问题是这是否是正确的方法,还是我应该根据同一个中心扩展每个预测器?
当我分析摘要数据时,我可以看到菌落大小是一个非常重要的预测因子,所以我想绘制性别比例〜菌落大小。
这是我遇到麻烦的地方。我首先创建了一个新的数据集,在那里我将所有其他预测变量的值保持在平均值,这样我就可以使用预测函数(对于我随机殖民地和岛屿的因素)。
newdata = data.frame(HL_Q = mean(mergeddata$HL_Q, na.rm = TRUE),
HL_Colony = mean(mergeddata$HL_Colony, na.rm = TRUE),
Colony= "J24",
Island = "Joskär",
Colony_size = mergeddata$Colony_size)
然后我使用预测函数来预测不同殖民地大小值的Y值。
newdata$y = predict(m_sexual_binom, newdata = newdata, type = "response")
我想绘制这些数据。以下只是我尝试过的很多东西的一个版本。性行为计算为性巢穴相对于总体育雏的比例。
plot(Sexuals~scale(Colony_size), data = mergeddata)
lines(newdata$y ~ scale(newdata$Colony_size))
我所坚持的是: - Colony_size是否已经在newdata data.frame中缩放,或者预测函数是否应该像这里那样获得非缩放预测变量? - 当我缩放并且不在新数据中缩放Colony_size时,图表都不正确。我没有得到逻辑回归应该产生的S曲线。
我希望我的问题很明确。如果需要,我很乐意提供更多信息。 非常感谢你的时间!