减少主轴线和R中ggplot的CI

时间:2011-05-23 21:30:11

标签: r ggplot2

无论如何都要将缩小的主轴线(理想情况下是CI)添加到ggplot中吗?我知道我可以使用method =“lm”来获得OLS,但似乎没有RMA的默认方法。我可以从包lmodel2获取RMA coefs和CI间隔,但添加geom_abline()似乎不起作用。这是虚拟数据和代码。我只想用一条RMA线和CI替换OLS线和CI:

dat <- data.frame(a=log10(rnorm(50, 30, 10)), b=log10(rnorm(50, 20, 2)))

ggplot(dat, aes(x=a, y=b) ) + 
    geom_point(shape=1) +       
    geom_smooth(method="lm") 

Edit1:下面的代码获得RMA(此处称为SMA - 标准化主轴)coefs和CI。包lmodel2提供更详细的输出,而package smatr只返回coefs和CI,如果有任何帮助的话:

library(lmodel2)
fit1 <- lmodel2(b ~ a, data=dat)

library(smatr)
fit2 <- line.cis(b, a, data=dat)

2 个答案:

答案 0 :(得分:7)

建立Joran的答案,我认为将整个数据框传递给geom_abline会更容易一些:

library(ggplot2)
library(lmodel2)

dat <- data.frame(a=log10(rnorm(50, 30, 10)), b=log10(rnorm(50, 20, 2)))
mod <- lmodel2(a ~ b, data=dat,"interval", "interval", 99)

reg <- mod$regression.results
names(reg) <- c("method", "intercept", "slope", "angle", "p-value")

ggplot(dat) + 
  geom_point(aes(b, a)) +
  geom_abline(data = reg, aes(intercept = intercept, slope = slope, colour = method))

答案 1 :(得分:5)

正如Chase所评论的那样,您使用的实际lmodel2()代码和ggplot代码会有所帮助。但这是一个可能指向正确方向的例子:

dat <- data.frame(a=log10(rnorm(50, 30, 10)), b=log10(rnorm(50, 20, 2)))
mod <- lmodel2(a ~ b, data=dat,"interval", "interval", 99)

#EDIT: mod is a list, with components (data.frames) regression.results and 
#        confidence.intervals containing the intercepts+slopes for different 
#        estimation methods; just put the right values into geom_abline
ggplot(dat,aes(x=b,y=a)) + geom_point() + 
   geom_abline(intercept=mod$regression.results[4,2],
            slope=mod$regression.results[4,3],colour="blue") + 
   geom_abline(intercept=mod$confidence.intervals[4,2],
            slope=mod$confidence.intervals[4,4],colour="red") + 
   geom_abline(intercept=mod$confidence.intervals[4,3],
            slope=mod$confidence.intervals[4,5],colour="red") + 
   xlim(c(-10,10)) + ylim(c(-10,10))

完全披露:我对RMA回归一无所知,所以我只是使用geom_abline()中的一些示例代码作为指导,将相关的斜率和截距删除并将它们放入lmodel2。在这个玩具示例中生成的CI似乎没有多大意义,因为我必须强制ggplot使用xlim()ylim()缩小以查看CI行(红色)。

但也许这可以帮助你在ggplot()中构建一个工作示例。

EDIT2:OPs添加代码来提取系数,ggplot()将是这样的:

ggplot(dat,aes(x=b,y=a)) + geom_point() + 
geom_abline(intercept=fit2[1,1],slope=fit2[2,1],colour="blue") + 
geom_abline(intercept=fit2[1,2],slope=fit2[2,2],colour="red") + 
geom_abline(intercept=fit2[1,3],slope=fit2[2,3],colour="red")