R中的boxplot,美学必须是长度1或与数据

时间:2017-03-01 02:29:21

标签: r dataframe plot ggplot2 boxplot

我正在对来自UCI网站的每加仑汽车里程数据做一些分析:

https://archive.ics.uci.edu/ml/datasets/Auto+MPG

我将第一列考虑到高或低里程:

mpg01 = I(auto1$mpg >= median(auto1$mpg))
Auto = data.frame(mpg01, auto1[,-1])
head(Auto)

    mpg01 cylinders displacement horsepower weight acceleration year origin
 1 FALSE         8          307        130   3504         12.0   70      1
 2 FALSE         8          350        165   3693         11.5   70      1
 3 FALSE         8          318        150   3436         11.0   70      1
 4 FALSE         8          304        150   3433         12.0   70      1
 5 FALSE         8          302        140   3449         10.5   70      1
 6 FALSE         8          429        198   4341         10.0   70      1

现在我想为数据框中的每个列制作一个boxplot,由第一列计算。

vars <- c("cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin")
ggplot(Auto) + geom_bar(aes(y=vars, fill=factor(mpg01)))

我收到错误“Aes必须是长度1或与数据相同”

“自动”数据帧的维度为392x8

我可以为每列使用boxplot,但想知道是否有办法将它们合并为一个。谢谢!

2 个答案:

答案 0 :(得分:2)

更新以解释生成的错误:生成错误是因为需要定义aes(x, y...)来描述数据框变量应如何映射到geoms中。在您的情况下,没有为x定义geom_boxplot变量。为了将x变量定义为df的每个列,需要将df重新整形为长格式(例如,使用reshape2::melttidyr::gather

以下是应该工作的解决方案,它基于mtcars而不是您的数据。如果没有,我们可以为您dput(Auto)解决一次问题。您生成的图表应该与我附加的图表类似。首先,重塑您的数据。

library(reshape2)
library(ggplot2)
mtcars_melt <- melt(mtcars)

我现在可以在x中定义aes。注意:与facet_wrap一起使用时,请注意下面两种情况之间的区别。

# First with no facet_wrap
ggplot(mtcars_melt, aes(x=variable, y=value, fill=variable)) + geom_boxplot()
# Case 1 with facet_wrap
ggplot(mtcars_melt, aes(x=variable, y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable)
# Case 2 with facet_wrap
ggplot(mtcars_melt, aes(x="", y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable)

在案例1中,我在x=variable中定义了aes,但是facet_wrap会强制每个方面都存在所有x个变量,但是如果我设置了x="",那么允许每个方面只保留1个变量。

现在,为了让y轴具有独立的比例,我可以设置scales="free_y"

ggplot(mtcars_melt, aes(x="", y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable, scales="free_y")

或者,我可以将scales="free"设置为同时适用于x轴和y轴,并将其与x=variable一起使用以获得类似的解决方案。

ggplot(mtcars_melt, aes(x=variable, y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable, scales="free")

enter image description here

已编辑:以下代码适用于您的特定数据集:

library(reshape2)
library(ggplot2)
vars <- c("cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin")
Auto_melt <- melt(Auto[, vars])
ggplot(Auto_melt, aes(x="", y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable, scales="free_y")

使用代码编辑,按要求按mpg分隔: 通过包含&#34; mpg01&#34;来重新定义变量,并通过mpg id融化数据。使用mpg01作为aes x值。

Auto <- structure(list(mpg01 = structure(c(2L, 1L, 1L, 1L, 1L), .Label = c("FALSE", "TRUE"), class = "factor"), cylinders = c(8L, 8L, 8L, 8L, 8L), displacement = c(307, 350, 318, 304, 302), horsepower = c(130L, 165L, 150L, 150L, 140L), weight = c(3504L, 3693L, 3436L, 3433L, 3449L), acceleration = c(12, 11.5, 11, 12, 10.5), year = c(70L, 70L, 70L, 70L, 70L), origin = c(1L, 1L, 1L, 1L, 1L)), .Names = c("mpg01", "cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin"), row.names = c(NA, 5L), class = "data.frame") 

vars <- c("mpg01", "cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin")
Auto_melt <- melt(Auto[, vars], id.vars="mpg01")
ggplot(Auto_melt, aes(x=mpg01, y=value, fill=variable)) + geom_boxplot() +    facet_wrap(~variable, scales="free_y")

enter image description here

答案 1 :(得分:1)

我想也许你应该整理你的数据,然后绘制boxplot。 我从网站上下载数据:

> head(df)
  mpg01 cylinders displacement horsepower weight acceleration year origin
1    18         8          307        130   3504         12.0   70      1
2    15         8          350        165   3693         11.5   70      1
3    18         8          318        150   3436         11.0   70      1
4    16         8          304        150   3433         12.0   70      1
5    17         8          302        140   3449         10.5   70      1
6    15         8          429        198   4341         10.0   70      1

使用收集{tidyr} 来整理数据。

library("tidyr")
library("dplyr")
library("ggplot2")
tidy_df <- df %>% gather("vars","values",-mpg01)

tidy_df是:

> head(tidy_df)
  mpg01      vars values
1    18 cylinders      8
2    15 cylinders      8
3    18 cylinders      8
4    16 cylinders      8
5    17 cylinders      8
6    15 cylinders      8

然后你可以绘制boxplot

ggplot(data=tidy_df,aes(vars,values)) + geom_boxplot(aes(fill=vars))

看起来像是这样的: enter image description here