R / ggplot2:在整个数据集上平滑,同时强制执行ylim上限

时间:2012-02-29 19:20:51

标签: r ggplot2 data-visualization smooth

更新:我找到了答案......包含在下面。

我有一个包含以下变量和类似值的数据集:

COBSDATE,   CITY, RESPONSE_TIME
2011-11-23  A     1.1
2011-11-23  A     1.5
2011-11-23  A     1.2
2011-11-23  B     2.3
2011-11-23  B     2.1
2011-11-23  B     1.8
2011-11-23  C     1.4
2011-11-23  C     6.1
2011-11-23  A     3.1
2011-11-23  A     1.1

我已成功创建一个图表,显示所有response_time值和平滑几何图形,以进一步描述某些变化。

我所面临的挑战是,我希望更好地了解平滑值,其中一个城市经常出现“异常值”。我可以通过在绘图中添加ylim(0,p99)来控制这个,但这会导致平滑只能在数据子集上计算。

有没有办法将所有这些数据用于平滑图,而唯一的子集用于抖动图?

我的代码在这里(除了+ ylim(0,20)之外都是相同的: 截断 -

ggplot(dataRaw, aes(x=COBSDATE, y=RESPONSE_TIME)) + 
    geom_jitter(colour=alpha("#007DB1", 1/8)) + 
    geom_smooth(colour="gray30", fill=alpha("gray40",0.5)) + 
    ylim(0,20) + 
    facet_wrap(~CITY)

整个数据集 -

ggplot(dataRaw, aes(x=COBSDATE, y=RESPONSE_TIME)) + 
    geom_jitter(colour=alpha("#007DB1", 1/8)) + 
    geom_smooth(colour="gray30", fill=alpha("gray40",0.5)) + 
    facet_wrap(~CITY)

2 个答案:

答案 0 :(得分:11)

如果您只想“放大”,可以使用coord_cartesian

ggplot(dataRaw, aes(x=COBSDATE, y=RESPONSE_TIME)) + 
  geom_jitter(colour=alpha("#007DB1", 1/8)) + 
  geom_smooth(colour="gray30", fill=alpha("gray40",0.5)) + 
  coord_cartesian(ylim=c(0,20)) + 
  facet_wrap(~CITY)

如果要使用抖动geom的数据子集,则覆盖数据继承:

ggplot(dataRaw, aes(x=COBSDATE, y=RESPONSE_TIME)) + 
  geom_jitter(data=subset(dataRaw, RESPONSE_TIME>=0 & RESPONSE_TIME<=20), 
              colour=alpha("#007DB1", 1/8)) + 
  geom_smooth(colour="gray30", fill=alpha("gray40",0.5)) + 
  ylim(0,20) + 
  facet_wrap(~CITY)

答案 1 :(得分:4)

更新的答案:所以,我正在寻找完全不同的东西,偶然发现了我需要的答案。

而不是ylim(0,yMax)应该使用coord_cartesian(ylim = c(0, yMax))

coord_cartesian似乎只是“缩放”图表而不是截断所包含的数据。