为了帮助填写R标签,我发布了一些我经常从学生那里收到的问题。多年来,我已经对这些问题做出了自己的答案,但也许还有更好的方法,我不知道。
问题:我刚刚使用连续y
和x
进行回归,但因子f
(其中levels(f)
生成c("level1","level2")
)
thelm <- lm(y~x*f,data=thedata)
现在,我想根据y
定义的组,按x
绘制f
的预测值。我得到的所有情节都是丑陋的,显示的线条太多了。
我的回答:尝试predict()
功能。
##restrict prediction to the valid data
##from the model by using thelm$model rather than thedata
thedata$yhat <- predict(thelm,
newdata=expand.grid(x=range(thelm$model$x),
f=levels(thelm$model$f)))
plot(yhat~x,data=thethedata,subset=f=="level1")
lines(yhat~x,data=thedata,subset=f=="level2")
是否有其他想法(1)对于新手更容易理解和/或(2)从其他角度更好?
答案 0 :(得分:17)
效果包具有良好的绘图方法,可以显示回归的预测值。
thedata<-data.frame(x=rnorm(20),f=rep(c("level1","level2"),10))
thedata$y<-rnorm(20,,3)+thedata$x*(as.numeric(thedata$f)-1)
library(effects)
model.lm <- lm(formula=y ~ x*f,data=thedata)
plot(effect(term="x:f",mod=model.lm,default.levels=20),multiline=TRUE)
答案 1 :(得分:3)
嗯 - 仍然试图将我的大脑包围在expand.grid()
。仅仅为了比较,我就是这样做的(使用ggplot2):
thedata <- data.frame(predict(thelm), thelm$model$x, thelm$model$f)
ggplot(thedata, aes(x = x, y = yhat, group = f, color = f)) + geom_line()
我认为ggplot()逻辑非常直观 - 用f对行进行分组和着色。随着组数量的增加,不必为每个组指定一个层越来越有用。
答案 2 :(得分:2)
我不是R的专家。但我使用:
xyplot(y ~ x, groups= f, data= Dat, type= c('p','r'),
grid= T, lwd= 3, auto.key= T,)
这也是一个选择:
interaction.plot(f,x,y, type="b", col=c(1:3),
leg.bty="0", leg.bg="beige", lwd=1, pch=c(18,24),
xlab="",
ylab="",
trace.label="",
main="Interaction Plot")
答案 3 :(得分:0)
这是对马特的优秀建议和类似于Helgi但与ggplot类似的解决方案的一个小改动。与上面的区别仅在于我使用了geom_smooth(method =&#39; lm),它直接绘制了回归线。
set.seed(1)
y = runif(100,1,10)
x = runif(100,1,10)
f = rep(c('level 1','level 2'),50)
thedata = data.frame(x,y,f)
library(ggplot2)
ggplot(thedata,aes(x=x,y=y,color=f))+geom_smooth(method='lm',se=F)