我有一些不同长度的不同载体,我想用ggplot2生成并排的箱形图。这与Base绘图系统相对简单。然而,ggplot2仅将单个数据帧作为输入,这很难从不同长度的数据创建。
a <- rnorm(10)
b <- rnorm(100)
c <- rnorm(1000)
boxplot(a, b, c)
问:使用不同长度的数据使用ggplot2绘制箱线图的正确方法是什么?
答案 0 :(得分:12)
ggplot使用整齐的长数据帧,其中组(如a,b或c)保存为单独的列。在您的示例中,您可以创建一个包含1110行(10 + 100 + 1000)和两列(值和组)的数据框,如下所示:
# Make individual data frames
a <- data.frame(group = "a", value = rnorm(10))
b <- data.frame(group = "b", value = rnorm(100))
c <- data.frame(group = "c", value = rnorm(1000))
# Combine into one long data frame
plot.data <- rbind(a, b, c)
# group value
# 1 a 0.2322682
# 2 a -0.9681992
# ...
# 101 b 0.3422354
# 102 b 0.3495342
# ...
# 1001 c -0.6839231
# 1002 c -1.4329843
# Plot
library(ggplot2)
ggplot(plot.data, aes(x=group, y=value, fill=group)) + geom_boxplot()