R框图使用多列中的因子

时间:2014-10-28 12:53:32

标签: r boxplot reshape2

我正在尝试使用R box plot可视化我的数据并卡住了。我的数据如下:

id  var.1 var.2 ... var.n value
a   0     1     ... 2     1.7
b   2     1     ... 0     1.4
... ...   ...   ... ...   ...
a   1     2     ... 2     5.3
b   1     2     ... 1     2.4

现在,我想要一系列的箱图:value~var.1,value~var.2,...,value~var.n 优选地,ggplot2 facet类型图。我尝试使用融化,重塑和分裂的尝试失败了 - 会感谢有新鲜思想的人在这里提示......

我认为重新塑造的数据应该是以下形式:

a var.1 0 1.7
a var.2 1 1.7
...
b var.1 2 1.4
b var.2 1 1.4
...

这样我就可以使用第2列和第2列的互动3 ...

2 个答案:

答案 0 :(得分:1)

数据

set.seed(1)
dat <- do.call(cbind.data.frame, rep(list(gl(3, 10)), 5))
names(dat) <- paste("var", 1:5, sep = ".")
dat$value <- rnorm(30)
head(dat)
#   var.1 var.2 var.3 var.4 var.5      value
# 1     1     1     1     1     1 -0.6264538
# 2     1     1     1     1     1  0.1836433
# 3     1     1     1     1     1 -0.8356286
# 4     1     1     1     1     1  1.5952808
# 5     1     1     1     1     1  0.3295078
# 6     1     1     1     1     1 -0.8204684

方式

首先,我们需要将数据转换为ggplot可以方便地工作的内容。您可以使用基础包中的reshape(另外,合成语不是不言自明的,我每次使用语法时都需要进行反复试验):

datm <- reshape(dat, direction = "long", varying = paste("var", 1:5, sep = "."), 
                new.row.names = 1:((ncol(dat) - 1) * nrow(dat)), timevar = "i", 
                v.names = "x")
head(datm)
#        value i x id
# 1 -0.6264538 1 1  1
# 2  0.1836433 1 1  2
# 3 -0.8356286 1 1  3
# 4  1.5952808 1 1  4
# 5  0.3295078 1 1  5
# 6 -0.8204684 1 1  6

现在,您可以通过boxplot(value ~ x)

进行ggplot2
library(ggplot2)
ggplot(datm, aes(x = x, y = value)) + geom_boxplot() + facet_wrap(~i)

enter image description here

这会回答你的问题吗?

答案 1 :(得分:1)

也可以使用融化功能:

library(reshape2)
melt(dat, id='value')
          value variable value
1   -0.11978146    var.1     1
2   -0.78996525    var.1     1
3    0.54246428    var.1     1
4    0.09325227    var.1     1
5    0.63954407    var.1     1
6    1.48611802    var.1     1
...