如何为变量子集ggplot2指定颜色

时间:2013-02-13 17:22:52

标签: r ggplot2

我有一个379838行的数据框和13列的变量(13个临床样本):

 >  str( df)
'data.frame':   379838 obs. of  13 variables:
  $ V1 : num  0.8146 0.7433 0.0174 0.177 0 ...
 $ V2 : num  0.7465 0.5833 0.0848 0.5899 0.0161 ...
 $ V3 : num  0.788 0.843 0.333 0.801 0.156 ...
 $ V4 : num  0.601 0.958 0.319 0.807 0.429 ...
 $ V5 : num  0.792 0.49 0.341 0.865 1 ...
 $ V6 : num  0.676 0.801 0.229 0.822 0.282 ...
 $ V7 : num  0.783 0.732 0.223 0.653 0.507 ...
 $ V8 : num  0.69 0.773 0.108 0.69 0.16 ...
 $ V9 : num  0.4014 0.5959 0.0551 0.7578 0.2784 ...
 $ V10: num  0.703 0.784 0.131 0.698 0.204 ...
 $ V11: num  0.6731 0.8224 0.125 0.6021 0.0772 ...
 $ V12: num  0.7889 0.7907 0.0881 0.7175 0.2392 ...
 $ V13: num  0.6731 0.8221 0.0341 0.4059 0 ...

我试图制作一个ggplot2箱形图,将变量分为三组:V1-V5,V6-V9和V10-V13,并为每组的变量分配不同的颜色。

我正在尝试以下代码:

    df1= as.vector(df[, c("V1", "V2", "V3","V4", "V5")])
    df2= as.vector(df[, c("V6","V7", "V8","V9")])
    df3=as.vector(df[, c( "V10","V11", "V12","V13")])
    sample= c(df1,df2,df3)

   library(reshape2)

  meltData1 <- melt(df, varnames="sample")

  str(meltData1)
 'data.frame':  4937894 obs. of  2 variables:
  $ variable: Factor w/ 13 levels "V1","V2","V3",..: 1 1 1 1 1 1 1 1 1 1 ...
  $ value   : num  0.8146 0.7433 0.0174 0.177 0 ...

   p=ggplot(data=meltData1,aes(variable,value, fill=x$sample))
   p+geom_boxplot()

这给了我白盒子图。如何为三组变量分配颜色?提前谢谢了!

2 个答案:

答案 0 :(得分:3)

由于未提供样本数据,因此制作了包含名称从V1V13的13列的新数据框。

df<-as.data.frame(matrix(rnorm(1300),ncol=13))

使用库melt()中的函数reshape2,数据将从宽格式转换为长格式。现在,数据框有两列:variablevalue

library(reshape2)
dflong<-melt(df)

添加长格式新列sample。在这里,我根据原始数据框中的行数和每个组中的原始列数重复了group1group2group3的名称。

dflong$sample<-c(rep("group1",nrow(df)*5),rep("group2",nrow(df)*4),rep("group3",nrow(df)*4))

新列与参数fill=一起使用,以根据分组设置颜色。

library(ggplot2)
ggplot(data=dflong,aes(variable,value, fill=sample))+geom_boxplot()

enter image description here

答案 1 :(得分:2)

这是Didzis Elferts的后续行动。

目标:将样本分成3个颜色组,颜色组内的颜色不同。

代码的第一部分是相同的:

df<-as.data.frame(matrix(rnorm(1300),ncol=13))
library(reshape2)
dflong<-melt(df)
dflong$sample<-c(rep("group1",nrow(df)*5),rep("group2",nrow(df)*4),rep("group3",nrow(df)*4))
library(ggplot2)

现在,使用包RColorBrewer选择颜色深浅

library(RColorBrewer)

按颜色类

创建颜色列表
col.g <- c(brewer.pal(9,"Greens"))[5:9] # select 5 colors from class Greens
col.r <- c(brewer.pal(9,"Reds"))[6:9] # select 4 colors from class Reds
col.b <- c(brewer.pal(9,"Blues"))[6:9] # select 4 colors from class Blues
my.cols <- c(col.g,col.r,col.b)

查看所选颜色:

image(1:13,1,as.matrix(1:13), col=my.cols, xlab="my palette", ylab="", xaxt="n", yaxt="n", bty="n")

现在用我们创造的颜色绘制

ggplot(data=dflong,aes(variable,value,colour=variable))+geom_boxplot()+scale_colour_manual(values = my.cols)

在上面,使用color和scale_colour_manual命令,只有线条被着色。下面,我们使用fill和scale_fill_manual:

   ggplot(data=dflong,aes(variable,value,fill=variable))+geom_boxplot()+scale_fill_manual(values = my.cols)

Here's an example of what I'm looking for

P.S。我是一个全新的自学者。我把这个问题视为应用我刚学到的东西的机会。