ggplot比例变换对点和函数的作用不同

时间:2016-05-15 09:55:18

标签: r ggplot2 transform normal-distribution cdf

我试图使用R和ggplot2绘制分发CDF。但是,在我转换Y轴以获得直线后,我发现在绘制CDF函数时遇到困难。 这种情节经常在Gumbel纸质图中使用,但在这里我将使用正态分布作为例子。

我生成数据,并绘制数据的累积密度函数和函数。他们很合适。但是,当我应用Y轴转换时,它们不再适合。

sim <- rnorm(100) #Simulate some data
sim <- sort(sim)  #Sort it

cdf <- seq(0,1,length.out=length(sim)) #Compute data CDF

df <- data.frame(x=sim, y=cdf) #Build data.frame

library(scales)
library(ggplot2)

#Now plot!
gg <- ggplot(df, aes(x=x, y=y)) +
        geom_point() +
        stat_function(fun = pnorm, colour="red")
gg

输出应该是: enter image description here 好!

现在我尝试根据使用的分布变换Y轴。

#Apply transformation
gg + scale_y_continuous(trans=probability_trans("norm"))

结果是: enter image description here

点被正确转换(它们位于一条直线上),但功能不是!

然而,如果我这样做,一切似乎都能正常工作,用ggplot计算CDF:

ggplot(data.frame(x=sim), aes(x=x)) +
  stat_ecdf(geom = "point") +
  stat_function(fun="pnorm", colour="red") +
  scale_y_continuous(trans=probability_trans("norm"))

结果还可以: This wokrs OK

为什么会这样?为什么不用手动计算CDF来进行比例变换?

1 个答案:

答案 0 :(得分:9)

这有效:

gg <- ggplot(df, aes(x=x, y=y)) +
  geom_point() +
  stat_function(fun ="pnorm", colour="red", inherit.aes = FALSE) +
  scale_y_continuous(trans=probability_trans("norm"))
gg

enter image description here

可能的解释:

文件状态: inherit.aes如果为FALSE,则覆盖默认美学,而不是与它们结合。这对于定义数据和美学的辅助函数最有用,并且不应该从默认的绘图规范继承行为,例如,边界。

我猜:scale_y_continuous改变主图的美学时,我们需要关闭默认的inherit.aes=TRUE。似乎inherit.aes=TRUE中的stat_function从图的第一层中选择了它的美学,因此除非特别选择,否则比例变换不会产生影响。