在ggplot中是否有与plot中的varwidth选项等效的?

时间:2012-09-28 21:42:56

标签: r plot ggplot2

我正在使用ggplot创建箱图,并希望表示对每个箱子有贡献的样本量。在基本plot函数中,有varwidth选项。它在ggplot中是否具有等价物?

例如,在基础图

data <- data.frame(rbind(cbind(rnorm(700, 0,10), rep("1",700)),
                         cbind(rnorm(50, 0,10), rep("2",50))))
data[ ,1] <- as.numeric(as.character(data[,1]))
plot(data[,1] ~ as.factor(data[,2]), varwidth = TRUE)

enter image description here

2 个答案:

答案 0 :(得分:7)

不优雅,但你可以通过以下方式实现:

data <- data.frame(rbind(cbind(rnorm(700, 0,10), rep("1",700)),
                         cbind(rnorm(50, 0,10), rep("2",50))))
data[ ,1] <- as.numeric(as.character(data[,1]))
w <- sqrt(table(data$X2)/nrow(data))
ggplot(NULL, aes(factor(X2), X1)) + 
  geom_boxplot(width = w[1], data = subset(data, X2 == 1)) +
  geom_boxplot(width = w[2], data = subset(data, X2 == 2))

enter image description here

如果您有X2的多个级别,那么您可以不对所有级别进行硬编码:

ggplot(NULL, aes(factor(X2), X1)) + 
  llply(unique(data$X2), function(i) geom_boxplot(width = w[i], data = subset(data, X2 == i)))

您也可以发布功能请求: https://github.com/hadley/ggplot2/issues

答案 1 :(得分:2)

ggplot2 (V 2.1.0)的当前版本现在包含varwidth选项:

data <- data.frame(rbind(cbind(rnorm(700, 0,10), rep("1",700)),
                     cbind(rnorm(50, 0,10), rep("2",50))))
data$X1 <- as.numeric(as.character(data$X1))
ggplot(data = data, aes(x = X2, y = X1)) + 
    geom_boxplot(varwidth = TRUE) 

Example output plot from ggplot2