在一个中添加几个箱形图

时间:2014-11-12 17:00:09

标签: r ggplot2 boxplot reshape2

我有一个数据集,我有三个不同的个人组,我们称之为绿色,红色和蓝色。然后我的数据涵盖了他们血液中的92种蛋白质,我从中获得了每组中每个个体的读数。

我想很好地了解每组蛋白质的差异和方法。这意味着我想制作一个多箱图。

我想在x轴上有不同的蛋白质,在每个蛋白质上面有三个箱形图(最好是不同的颜色)(每组一个),在y轴上有数字蛋白质重量。

我该怎么做?

我目前正在使用数据框,其中组被行划分,每列中的蛋白读数不同。

试图添加图片,但显然你需要声望点......

我听说你可以在reshape2中使用melt命令,但是我需要有关如何使用它的指导。

请简化答案。对于R来说,我不是很有经验。

1 个答案:

答案 0 :(得分:1)

看,我意识到当你第一次入门时事情令人沮丧,但是你将不得不提出具体而有针对性的问题,让人们愿意并能够以结构化的方式帮助你。

话虽如此,让我们来看一个结构化的例子。我这里只会使用9种蛋白质,但你应该明白这一点。

library(ggplot2)
library(reshape2)

# Setup a data frame, since the question did not provide one...
df <- structure(list(Individual = 1:12, 
                     Group = structure(c(2L, 1L, 3L, 2L, 1L, 3L, 2L, 1L, 3L, 2L, 1L, 3L), 
                              .Label = c("Blue", "Green", "Red"), class = "factor"), 
                     Protein_1 = c(82L, 23L, 19L, 100L, 33L, 86L, 32L, 41L, 39L, 59L, 93L, 99L), 
                     Protein_2 = c(86L, 50L, 86L, 90L, 37L, 20L, 26L, 38L, 87L, 81L, 23L, 49L), 
                     Protein_3 = c(81L, 31L, 5L, 10L, 79L, 40L, 27L, 73L, 64L, 30L, 87L, 64L), 
                     Protein_4 = c(52L, 15L, 25L, 12L, 63L, 52L, 60L, 33L, 27L, 32L, 53L, 93L), 
                     Protein_5 = c(19L, 75L, 25L, 14L, 33L, 60L, 73L, 13L, 92L, 92L, 91L, 12L), 
                     Protein_6 = c(33L, 49L, 29L, 58L, 51L, 12L, 61L, 48L, 71L, 18L, 84L, 31L), 
                     Protein_7 = c(84L, 57L, 28L, 99L, 47L, 54L, 72L, 97L, 73L, 46L, 68L, 37L), 
                     Protein_8 = c(15L, 16L, 46L, 95L, 57L, 86L, 30L, 83L, 45L, 12L, 49L, 82L), 
                     Protein_9 = c(84L, 91L, 33L, 10L, 91L, 91L, 4L, 88L, 42L, 82L, 76L, 95L)), 
                .Names = c("Individual", "Group", "Protein_1", "Protein_2", "Protein_3", 
                           "Protein_4", "Protein_5", "Protein_6", "Protein_7", "Protein_8", "Protein_9"), 
                class = "data.frame", row.names = c(NA, -12L))

head(df)
# Individual Group Protein_1 Protein_2 Protein_3 Protein_4 Protein_5 Protein_6 Protein_7 Protein_8 Protein_9
# 1          1 Green        82        86        81        52        19        33        84        15        84
# 2          2  Blue        23        50        31        15        75        49        57        16        91
# 3          3   Red        19        86         5        25        25        29        28        46        33
# 4          4 Green       100        90        10        12        14        58        99        95        10
# 5          5  Blue        33        37        79        63        33        51        47        57        91
# 6          6   Red        86        20        40        52        60        12        54        86        91
?melt
df.melted <- melt(df, id.vars = c("Individual", "Group"))
head(df.melted)
# Individual Group  variable value
# 1          1 Green Protein_1    82
# 2          2  Blue Protein_1    23
# 3          3   Red Protein_1    19
# 4          4 Green Protein_1   100
# 5          5  Blue Protein_1    33
# 6          6   Red Protein_1    86

# First Protein
# Notice I am using subset()
ggplot(data = subset(df.melted, variable == "Protein_1"),
       aes(x = Group, y = value)) + geom_boxplot(aes(fill = Group))

Protein 1

# Second Protein
ggplot(data = subset(df.melted, variable == "Protein_2"),
       aes(x = Group, y = value)) + geom_boxplot(aes(fill = Group))

Protein 2

# and so on...

# You could also use facets
ggplot(data = df.melted, aes(x = Group, y = value)) + 
  geom_boxplot(aes(fill = Group)) +
  facet_wrap(~ variable)

Facets

是的,我意识到颜色分组与情节的颜色不一致......我将把它作为一个练习...你必须愿意多次修补,探索和失败。< / p>