我在R中使用GLMM,其中混合了连续变量和分类变量以及一些相互作用。我在MuMIn中使用了dredge和model.avg函数来获得每个变量的效果估计。我的问题是如何最好地绘制结果。我想制作一个数字,显示一个变量(森林)对我的数据的影响,其中趋势线反映森林参数估计,但我无法弄清楚如何在他们的&#39处保存分类变量和交互变量;平均'所以趋势线只反映了森林的影响。
这里是模型和情节设置:
#load packages and document
cuckoo<-read.table("http://www.acsu.buffalo.edu/~ciaranwi/home_range.txt",
header=T,sep="\t")
require(lme4)
require(MuMIn)
as.factor (cuckoo$ID)
as.factor (cuckoo$Sex)
as.factor(cuckoo$MS_bin)
options(na.action = "na.fail")
# create global model and fit
fm<- lmer(log(KD_95)~ MS_bin + Forest + NDVI + Sex + Precip + MS_bin*Forest
+ MS_bin*NDVI + MS_bin*Sex + MS_bin*Precip + Argos + Sample + (1|ID), data
= cuckoo, REML = FALSE)
# dredge but always include argos and sample
KD95<-dredge(fm,fixed=c("Argos","Sample"))
# model averaging
avgmod<-model.avg(KD95, fit=TRUE)
summary(avgmod)
#plot data
plot(cuckoo$Forest, (log(cuckoo$KD_95)),
xlab = "Mean percentage of forest cover",
ylab = expression(paste(plain("Log of Kernel density estimate, 95%
utilisation, km"^{2}))),
pch = c(15,17)[as.numeric(cuckoo$MS_bin)],
main = "Forest cover",
col="black",
ylim=c(14,23))
legend(80,22, c("Breeding","Nonbreeding"), pch=c(15, 17), cex=0.7)
然后我不知道如何包含趋势线。到目前为止,我有:
#parameter estimates from model.avg
argos_est<- -1.6
MS_est<- -1.77
samp_est<-0.01
forest_est<--0.02
sex_est<-0.0653
precip_est<-0.0004
ndvi_est<--0.00003
model_intercept<-22.7
#calculate mean values for parameters
argos_mean<-mean(cuckoo$Argos)
samp_mean<-mean(cuckoo$Sample)
forest_mean<-mean(cuckoo$Forest)
ndvi_mean<-mean(cuckoo$NDVI)
precip_mean<-mean(cuckoo$Precip)
#calculate the intercept and add trend line
intercept<-(model_intercept + (forest_est*cuckoo$Forest) +
(argos_est*argos_mean) + (samp_est * samp_mean) + (ndvi_est*ndvi_mean) +
(precip_est*precip_mean) )
abline(intercept, forest_est)
但是这并没有考虑交互或分类变量,截距看起来太高了。有什么想法吗?
答案 0 :(得分:4)
就过程而言,您可以利用R在模型对象中存储大量有关模型的信息并具有从模型对象中获取信息的功能,从而使编码变得更加容易。例如,coef(avgmod)
将为您提供模型系数,predict(avgmod)
将为您提供模型的预测,用于您用于拟合模型的数据框中的每个观察。
为了显示我们感兴趣的特定数据值组合的预测,创建一个新数据框,其中包含我们想要保持的变量的均值,以及我们想要的变量的一系列值变化(如Forest
)。 expand.grid
创建一个数据框,其中包含下列值的所有组合。
pred.data = expand.grid(Argos=mean(cuckoo$Argos), Sample=mean(cuckoo$Sample),
Precip=mean(cuckoo$Precip), NDVI=mean(cuckoo$NDVI),
Sex="M", Forest=seq(0,100,10), MS_bin=unique(cuckoo$MS_bin),
ID=unique(cuckoo$ID))
现在我们使用predict
函数将log(KD_95)的预测添加到此数据框。 predict
负责为您提供的任何数据计算模型预测(假设您为其提供包含模型中所有变量的数据框)。
pred.data$lgKD_95_pred = predict(avgmod, newdata=pred.data)
现在我们绘制结果。 geom_point
绘制点,就像在原始图中一样,然后geom_line
为MS_bin
的每个级别添加预测(和性别=&#34; M&#34;)。
library(ggplot2)
ggplot() +
geom_point(data=cuckoo, aes(Forest, log(KD_95), shape=factor(MS_bin),
colour=factor(MS_bin), size=3)) +
geom_line(data=pred.data, aes(Forest, lKD_95_pred, colour=factor(MS_bin)))
结果如下:
更新:要绘制男性和女性的回归线,只需要包含性别=&#34; F&#34;在pred.data
中添加Sex
作为情节中的审美。在下面的示例中,我在绘制点和不同的线类型时使用不同的形状来标记Sex
以标记回归线的Sex
。
pred.data = expand.grid(Argos=mean(cuckoo$Argos), Sample=mean(cuckoo$Sample),
Precip=mean(cuckoo$Precip), NDVI=mean(cuckoo$NDVI),
Sex=unique(cuckoo$Sex), Forest=seq(0,100,10), MS_bin=unique(cuckoo$MS_bin),
ID=unique(cuckoo$ID))
pred.data$lgKD_95_pred = predict(avgmod, newdata=pred.data)
ggplot() +
geom_point(data=cuckoo, aes(Forest, log(KD_95), shape=Sex,
colour=factor(MS_bin)), size=3) +
geom_line(data=pred.data, aes(Forest, lgKD_95_pred, linetype=Sex,
colour=factor(MS_bin)))
答案 1 :(得分:1)
我希望我不会错过这一点,但是如果你想要一个线性趋势,你实际上不必手动计算所有东西,而是得到你绘制的并且拟合ay~x线性回归模型,如下所示: / p>
model = lm(log(cuckoo$KD_95)~cuckoo$Forest)
model
# Call:
# lm(formula = log(cuckoo$KD_95) ~ cuckoo$Forest)
#
# Coefficients:
# (Intercept) cuckoo$Forest
# 17.13698 -0.01461
abline(17.13698 , -0.01461, col="red")
红线使用了回归拟合的截距和斜率。黑线是您的手动过程。