geom_smooth中的自定义lm公式

时间:2013-11-27 10:49:00

标签: r ggplot2

我正在使用分面图,并使用lm

中的geom_smooth()方法添加线条
d<-data.frame(n=c(100, 80, 60, 55, 50, 102, 78, 61, 42, 18),
              year=rep(2000:2004, 2), 
              cat=rep(c("a", "b"), each=5))

ggplot(d, aes(year, n, group=cat))+geom_line()+geom_point()+
  facet_wrap(~cat, ncol=1)+
  geom_smooth(method="lm")

我想设置一个函数来适当地应用多项式。我已经完成了一项功能:

lm.mod<-function(df){
  m1<-lm(n~year, data=df)
  m2<-lm(n~year+I(year^2), data=df)
  ifelse(AIC(m1)<AIC(m2), "y~x", "y~poly(x, 2)")
}

但是我在应用它时遇到了麻烦。任何想法,或更好的方法来处理这个?

2 个答案:

答案 0 :(得分:7)

单个geom_smooth调用无法应用不同的平滑函数。这是一个基于平滑数据子集的解决方案:

首先,创建没有geom_smooth的基础图:

library(ggplot2)
p <- ggplot(d, aes(year, n, group = cat)) +
       geom_line() +
       geom_point() +
       facet_wrap( ~ cat, ncol = 1)

其次,函数by用于为geom_smooth的每个级别(用于构面的变量)创建cat。此函数返回一个列表。

p_smooth <- by(d, d$cat, 
               function(x) geom_smooth(data=x, method = lm, formula = lm.mod(x)))

现在,您可以将geom_smooth的列表添加到基础图中:

p + p_smooth

该图包括上面板的二阶多项式和下面板的线性光滑:

enter image description here

答案 1 :(得分:1)

lm.mod<-function(df){
  m1<-lm(n~year, data=df)
  m2<-lm(n~year+I(year^2), data=df)
  p <- ifelse(AIC(m1)<AIC(m2), "y~x", "y~poly(x, 2)")
return(p) 
}
# I only made the return here explicit out of personal preference

ggplot(d, aes(year, n, group=cat)) + geom_line() + geom_point() +
  facet_wrap(~cat, ncol=1)+
  stat_smooth(method=lm, formula=lm.mod(d))
# stat_smooth and move of your function to formula=

# test by reversing the condition and you should get a polynomial.
# lm.mod<-function(df){
#   m1<-lm(n~year, data=df)
#   m2<-lm(n~year+I(year^2), data=df)
#   p <- ifelse(AIC(m1)>AIC(m2), "y~x", "y~poly(x, 2)")
# return(p)
# }