R:Boxplot如何以有效的方式制定数据

时间:2017-09-19 16:00:20

标签: r plot ggplot2 boxplot melt

我使用的数据是

> head(df2)
       Results Capacity Power  LDI  LDE      LB  PDC   D E1 E2 E3 E4 E5 E6 E7 E8 E9
1 DCNoV2GYesDC       C1  PG11 LDI0 LDE0 LB0.045 PDC0 D10 30 NA 20 3 1 5 NA NA NA 20
2 DCNoV2GYesDC    C0.95  PG11 LDI0 LDE2 LB0.045 PDC0 D10 8  3  NA  8  9 NA NA NA NA
3 DCNoV2GYesDC     C0.9  PG11 LDI0 LDE2 LB0.045 PDC0 D10 8  NA  5  NA  6 7 NA NA NA
4 DCNoV2GYesDC    C0.85  PG11 LDI0 LDE2 LB0.045 PDC0 D10 NA NA NA NA NA NA NA NA NA
5 DCNoV2GYesDC     C0.8  PG11 LDI0 LDE3 LB0.045 PDC0 D10 NA NA NA NA NA NA NA NA NA
6 DCNoV2GYesDC    C0.75  PG11 LDI0 LDE3 LB0.045 PDC0 D10 NA NA  1  1 NA  1 NA 50 70

我写了一个循环来在一个脚本中绘制多个bowplot:

df2 <- myfun2(Impact$X__3, EV)
Box.graph <- function(df2, na.rm = TRUE, ...){
  Caplist <- unique(df2$Capacity) 
y <- df2[df2$Capacity==Caplist[i],1:9]
  for (i in seq_along(Caplist)){
    boxplot <- 
      ggplot(subset(df2, df2$Capacity==Caplist[i]),
             aes(LDI, y=value , colour = LDI), group = df2$Capacity) +
      geom_boxplot() +
      theme(axis.text.x = element_text(size=14))+
      facet_wrap( ~ PDC, ncol =1)+ 
      theme(legend.position = "top")+
      scale_y_continuous("time")+
      scale_x_continuous("LDI")+
      ggtitle(paste(Caplist[i], ' LDE \n', 
                    "time \n",
                    sep=''))
    #save plot as PNG 
    ggsave(plot = last_plot(), file= paste(StoreResults, '/Results/',
                                           Caplist[i], "YesDCNoV2G.png", sep=''), scale=2)
    print(boxplot)
  }
}
#Run the function  
Box.graph(df2)

我遇到的问题是这段代码没有出错,也没有运行。我认为问题是y =值部分不正确或没有正确定义。

我尝试通过添加一行y <- df2[df2$Capacity==Caplist[i],1:9]来修复问题,并添加了`y = df2 [df2 $ Capacity == Caplist [i],1:9]&#39;在ggplot部分中建议here。仍然没有结果。有人还指出我应该将数据融化:但我不知道最有效的方法是使用我的数据。

所需的输出是几个箱图,其值为E1,E2,E3,E4,E5,E6,E7,E8 and E9。因此,例如,第一个箱图应包含值:30 NA 20 3 1 5 NA NA NA 20

1 个答案:

答案 0 :(得分:1)

请尝试这个简化的功能(很难在没有真实数据的情况下进行测试):

Box.graph <- function(df2, naRM = TRUE) {
    library(data.table)
    library(ggplot2)

    setDT(df2)
    foo <- melt(df2, c("LDI", "PDC", "Capacity"))[variable %in% paste0("E", 1:9)]
    if (naRM) {
        foo <- foo[!is.na(value)]
    }
    p <- ggplot(foo, aes(LDI, value, fill = LDI)) +
        geom_boxplot() +
        facet_wrap(Capacity ~ PDC)
    ggsave(plot = p, file = paste0(StoreResults, "/Results/YesDCNoV2G.png"), scale=2)
    return(NULL)
}
Box.graph(df2)