我正在尝试为多级分组箱图保留“空白空间”。
set.seed(42)
n <- 100
dat <- data.frame(x=runif(n),
cat1=sample(letters[1:4], size=n, replace=TRUE),
cat2=sample(LETTERS[1:3], size=n, replace=TRUE))
ggplot(dat, aes(cat1, x)) + geom_boxplot(aes(fill=cat2))
如果我强制其中一个组为空:
dat <- subset(dat, ! (cat1 == 'b' & cat2 == 'B'))
table(dat$cat1, dat$cat2)
##
## A B C
## a 9 9 7
## b 8 0 5
## c 13 11 6
## d 11 10 5
ggplot(dat, aes(cat1, x)) + geom_boxplot(aes(fill=cat2))
第二组“b”现在已扩展到填补空间。我想要的是:
SO 9818835(强制显示空白级别)在顶级工作正常,但我无法弄清楚如何使其适用于第二级别的类别。在scale_x_discrete(...)
中,我尝试设置:
breaks=letters[1:4]
breaks=LETTERS[1:3]
breaks=list(letters[1:4], LETTERS[1:3])
(刺伤)breaks=NULL
breaks=func
其中func <- function(x, ...) { browser(); 1; }
为了排除故障;它只提供letters[1:4]
并且从未提示进入第二级使用interactions(letters[1:4], LETTERS[1:3])
仍然不会留空空间。我尝试了一种解决方法,通过注入越界x
值并使用scale_y_continuous(limits)
强制它离开屏幕,但ggplot2
对我来说太聪明了,并再次缩小差距。
是否有优雅(即ggplot2
机制中的“正确”)解决方案?
答案 0 :(得分:7)
coord_cartesian
可以成为您正在寻找的解决方案吗?
它会放大并且不会试图“智取”scale_y_continuous
library(dplyr)
library(ggplot2)
set.seed(42)
n <- 100
dat <- data.frame(x=runif(n),
cat1=sample(letters[1:4], size=n, replace=TRUE),
cat2=sample(LETTERS[1:3], size=n, replace=TRUE))
LARGE_VALUE <- 2
dat <- dat %>%
mutate(x = ifelse(cat1 == 'b' & cat2 == 'B',
LARGE_VALUE,
x))
ggplot(dat, aes(cat1, x)) +
geom_boxplot(aes(fill=cat2)) +
coord_cartesian(ylim = c(0,1))