我正在对来自UCI网站的每加仑汽车里程数据做一些分析:
https://archive.ics.uci.edu/ml/datasets/Auto+MPG
我将第一列考虑到高或低里程:
mpg01 = I(auto1$mpg >= median(auto1$mpg))
Auto = data.frame(mpg01, auto1[,-1])
head(Auto)
mpg01 cylinders displacement horsepower weight acceleration year origin
1 FALSE 8 307 130 3504 12.0 70 1
2 FALSE 8 350 165 3693 11.5 70 1
3 FALSE 8 318 150 3436 11.0 70 1
4 FALSE 8 304 150 3433 12.0 70 1
5 FALSE 8 302 140 3449 10.5 70 1
6 FALSE 8 429 198 4341 10.0 70 1
现在我想为数据框中的每个列制作一个boxplot,由第一列计算。
vars <- c("cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin")
ggplot(Auto) + geom_bar(aes(y=vars, fill=factor(mpg01)))
我收到错误“Aes必须是长度1或与数据相同”
“自动”数据帧的维度为392x8
我可以为每列使用boxplot,但想知道是否有办法将它们合并为一个。谢谢!
答案 0 :(得分:2)
更新以解释生成的错误:生成错误是因为需要定义aes(x, y...)
来描述数据框变量应如何映射到geoms中。在您的情况下,没有为x
定义geom_boxplot
变量。为了将x
变量定义为df的每个列,需要将df重新整形为长格式(例如,使用reshape2::melt
或tidyr::gather
)
以下是应该工作的解决方案,它基于mtcars而不是您的数据。如果没有,我们可以为您dput(Auto)
解决一次问题。您生成的图表应该与我附加的图表类似。首先,重塑您的数据。
library(reshape2)
library(ggplot2)
mtcars_melt <- melt(mtcars)
我现在可以在x
中定义aes
。注意:与facet_wrap
一起使用时,请注意下面两种情况之间的区别。
# First with no facet_wrap
ggplot(mtcars_melt, aes(x=variable, y=value, fill=variable)) + geom_boxplot()
# Case 1 with facet_wrap
ggplot(mtcars_melt, aes(x=variable, y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable)
# Case 2 with facet_wrap
ggplot(mtcars_melt, aes(x="", y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable)
在案例1中,我在x=variable
中定义了aes
,但是facet_wrap
会强制每个方面都存在所有x个变量,但是如果我设置了x=""
,那么允许每个方面只保留1个变量。
现在,为了让y轴具有独立的比例,我可以设置scales="free_y"
ggplot(mtcars_melt, aes(x="", y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable, scales="free_y")
或者,我可以将scales="free"
设置为同时适用于x轴和y轴,并将其与x=variable
一起使用以获得类似的解决方案。
ggplot(mtcars_melt, aes(x=variable, y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable, scales="free")
已编辑:以下代码适用于您的特定数据集:
library(reshape2)
library(ggplot2)
vars <- c("cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin")
Auto_melt <- melt(Auto[, vars])
ggplot(Auto_melt, aes(x="", y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable, scales="free_y")
使用代码编辑,按要求按mpg分隔: 通过包含&#34; mpg01&#34;来重新定义变量,并通过mpg id融化数据。使用mpg01作为aes x值。
Auto <- structure(list(mpg01 = structure(c(2L, 1L, 1L, 1L, 1L), .Label = c("FALSE", "TRUE"), class = "factor"), cylinders = c(8L, 8L, 8L, 8L, 8L), displacement = c(307, 350, 318, 304, 302), horsepower = c(130L, 165L, 150L, 150L, 140L), weight = c(3504L, 3693L, 3436L, 3433L, 3449L), acceleration = c(12, 11.5, 11, 12, 10.5), year = c(70L, 70L, 70L, 70L, 70L), origin = c(1L, 1L, 1L, 1L, 1L)), .Names = c("mpg01", "cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin"), row.names = c(NA, 5L), class = "data.frame")
vars <- c("mpg01", "cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin")
Auto_melt <- melt(Auto[, vars], id.vars="mpg01")
ggplot(Auto_melt, aes(x=mpg01, y=value, fill=variable)) + geom_boxplot() + facet_wrap(~variable, scales="free_y")
答案 1 :(得分:1)
我想也许你应该整理你的数据,然后绘制boxplot。 我从网站上下载数据:
> head(df)
mpg01 cylinders displacement horsepower weight acceleration year origin
1 18 8 307 130 3504 12.0 70 1
2 15 8 350 165 3693 11.5 70 1
3 18 8 318 150 3436 11.0 70 1
4 16 8 304 150 3433 12.0 70 1
5 17 8 302 140 3449 10.5 70 1
6 15 8 429 198 4341 10.0 70 1
使用收集{tidyr} 来整理数据。
library("tidyr")
library("dplyr")
library("ggplot2")
tidy_df <- df %>% gather("vars","values",-mpg01)
tidy_df是:
> head(tidy_df)
mpg01 vars values
1 18 cylinders 8
2 15 cylinders 8
3 18 cylinders 8
4 16 cylinders 8
5 17 cylinders 8
6 15 cylinders 8
然后你可以绘制boxplot
ggplot(data=tidy_df,aes(vars,values)) + geom_boxplot(aes(fill=vars))