使用R中的ggplot在累积频率图下填充交叉

时间:2015-08-06 15:26:19

标签: r ggplot2 fill cdf ecdf

我试图在ggplot中绘制两条累积频率曲线,并在某个截止处遮挡交叉。我没有长时间使用ggplot,所以我希望有人可以帮我这个。

没有填充区域的图表看起来像这样...... Cumulative Frequency for North and South regions

我使用以下代码创建的内容......

library(ggplot2) # required 

north <- rnorm(3060, mean=277,sd=3.01) # to create synthetic data 
south <- rnorm(3060, mean=278, sd=3.26) # in place of my real data. 

#placing in dataframe
df_temp <- data.frame(temp=c(north,south), 
    region=c(rep("north",length=3060),rep("south",length=3060)))

#manipulating into cdf, as I've seen in other examples
temp.regions <- ddply(df_temp, .(region), summarize,
                          temp = unique(temp),
                          ecdf = ecdf(temp)(unique(temp)))

# feeding into ggplot. 
 ggplot(temp.regions,aes(x=temp, y=ecdf, color = region)) + 
      geom_line(aes(x=temp,color=region))+
      scale_colour_manual(values = c("blue","red"))

我想要的是,在y轴上为温度低于0.2的两条曲线着色。理想情况下,我希望看到蓝色的蓝色阴影,红色的阴影红色。然后,他们在紫色的地方交叉。

但是,我管理的最接近的内容如下...... My first attempt at getting areas under the curve]

我使用以下添加到我的代码中实现了这一点。

# creating a dataframe with just the temperatures for below 0.2
# to try and aid control when plotting
temp.below <- temp.regions[which(temp.regions$ecdf<0.2),]

# plotting routine again. 
ggplot(temp.regions, aes(x=temp, y=ecdf, color = region)) + 
  geom_line(aes(x=temp,color=region))+
  scale_colour_manual(values = c("blue","red"))+
# with additional line for shading.
  geom_ribbon(data=temp.below,
              aes(x=temp,ymin=0,ymax=0.2), alpha=0.5)

我已经看到了一些正常分布密度图的阴影示例,这是我调整代码的地方。但出于某种原因,我的盒子似乎并不想要与温度曲线有任何关系。

请帮忙!我确信它很简单,我只是真的迷失了,尝试了一些,产生的结果不如这些。

非常感谢你看一看。

问题解决了以下帮助...

从下面运行建议代码

geom_ribbon(aes(ymin=0,ymax=ecdf, fill=region), alpha=0.5)

给...

enter image description here

这几乎是我所追求的解决方案,但最后一个补充......就像这样

#geom_ribbon(aes(ymin=0,ymax=ecdf, fill=region), alpha=0.5)
geom_ribbon(data=temp.below, aes(ymin=0,ymax=ecdf, fill=region), alpha=0.5)

我得到了我所追求的...... enter image description here

我再次设置数据的原因是它只填充了两个区域中最低的20%。

非常感谢您的帮助:-)

1 个答案:

答案 0 :(得分:0)

看起来你正在以正确的方式思考它。 使用geom_ribbon我认为您不需要将数据设置为其他任何内容。只需设置aes(ymin = 0, ymax = ecdf, fill = region)即可。我认为应该这样做。