我正在尝试使用R box plot可视化我的数据并卡住了。我的数据如下:
id var.1 var.2 ... var.n value
a 0 1 ... 2 1.7
b 2 1 ... 0 1.4
... ... ... ... ... ...
a 1 2 ... 2 5.3
b 1 2 ... 1 2.4
现在,我想要一系列的箱图:value~var.1,value~var.2,...,value~var.n 优选地,ggplot2 facet类型图。我尝试使用融化,重塑和分裂的尝试失败了 - 会感谢有新鲜思想的人在这里提示......
我认为重新塑造的数据应该是以下形式:
a var.1 0 1.7
a var.2 1 1.7
...
b var.1 2 1.4
b var.2 1 1.4
...
这样我就可以使用第2列和第2列的互动3 ...
答案 0 :(得分:1)
数据强>
set.seed(1)
dat <- do.call(cbind.data.frame, rep(list(gl(3, 10)), 5))
names(dat) <- paste("var", 1:5, sep = ".")
dat$value <- rnorm(30)
head(dat)
# var.1 var.2 var.3 var.4 var.5 value
# 1 1 1 1 1 1 -0.6264538
# 2 1 1 1 1 1 0.1836433
# 3 1 1 1 1 1 -0.8356286
# 4 1 1 1 1 1 1.5952808
# 5 1 1 1 1 1 0.3295078
# 6 1 1 1 1 1 -0.8204684
方式强>
首先,我们需要将数据转换为ggplot
可以方便地工作的内容。您可以使用基础包中的reshape
(另外,合成语不是不言自明的,我每次使用语法时都需要进行反复试验):
datm <- reshape(dat, direction = "long", varying = paste("var", 1:5, sep = "."),
new.row.names = 1:((ncol(dat) - 1) * nrow(dat)), timevar = "i",
v.names = "x")
head(datm)
# value i x id
# 1 -0.6264538 1 1 1
# 2 0.1836433 1 1 2
# 3 -0.8356286 1 1 3
# 4 1.5952808 1 1 4
# 5 0.3295078 1 1 5
# 6 -0.8204684 1 1 6
现在,您可以通过boxplot(value ~ x)
:
ggplot2
library(ggplot2)
ggplot(datm, aes(x = x, y = value)) + geom_boxplot() + facet_wrap(~i)
这会回答你的问题吗?
答案 1 :(得分:1)
也可以使用融化功能:
library(reshape2)
melt(dat, id='value')
value variable value
1 -0.11978146 var.1 1
2 -0.78996525 var.1 1
3 0.54246428 var.1 1
4 0.09325227 var.1 1
5 0.63954407 var.1 1
6 1.48611802 var.1 1
...