ggplot2:强制空的二级类别

时间:2015-10-21 21:55:25

标签: r ggplot2 boxplot

我正在尝试为多级分组箱图保留“空白空间”。

set.seed(42)
n <- 100
dat <- data.frame(x=runif(n),
                  cat1=sample(letters[1:4], size=n, replace=TRUE),
                  cat2=sample(LETTERS[1:3], size=n, replace=TRUE))
ggplot(dat, aes(cat1, x)) + geom_boxplot(aes(fill=cat2))

enter image description here

如果我强制其中一个组为空:

dat <- subset(dat, ! (cat1 == 'b' & cat2 == 'B'))
table(dat$cat1, dat$cat2)
##    
##      A  B  C
##   a  9  9  7
##   b  8  0  5
##   c 13 11  6
##   d 11 10  5
ggplot(dat, aes(cat1, x)) + geom_boxplot(aes(fill=cat2))

enter image description here

第二组“b”现在已扩展到填补空间。我想要的是:

enter image description here

SO 9818835(强制显示空白级别)在顶级工作正常,但我无法弄清楚如何使其适用于第二级别的类别。在scale_x_discrete(...)中,我尝试设置:

  • breaks=letters[1:4]
  • breaks=LETTERS[1:3]
  • breaks=list(letters[1:4], LETTERS[1:3])(刺伤)
  • breaks=NULL
  • breaks=func其中func <- function(x, ...) { browser(); 1; }为了排除故障;它只提供letters[1:4]并且从未提示进入第二级

使用interactions(letters[1:4], LETTERS[1:3])仍然不会留空空间。我尝试了一种解决方法,通过注入越界x值并使用scale_y_continuous(limits)强制它离开屏幕,但ggplot2对我来说太聪明了,并再次缩小差距。

是否有优雅(即ggplot2机制中的“正确”)解决方案?

1 个答案:

答案 0 :(得分:7)

coord_cartesian可以成为您正在寻找的解决方案吗?

它会放大并且不会试图“智取”scale_y_continuous

等数据
library(dplyr)
library(ggplot2)

set.seed(42)
n <- 100
dat <- data.frame(x=runif(n),
                  cat1=sample(letters[1:4], size=n, replace=TRUE),
                  cat2=sample(LETTERS[1:3], size=n, replace=TRUE))

LARGE_VALUE <- 2

dat <- dat %>%
  mutate(x = ifelse(cat1 == 'b' & cat2 == 'B', 
                    LARGE_VALUE,
                    x))

ggplot(dat, aes(cat1, x)) + 
  geom_boxplot(aes(fill=cat2)) + 
  coord_cartesian(ylim = c(0,1))

enter image description here