使用scale_color_gradientn在ggplot2中生成的图表列表具有错误的着色

时间:2018-02-23 13:04:41

标签: r ggplot2

我正在尝试使用library(scales)scale_color_gradientn()创建颜色到连续变量的自定义映射,以尝试限制异常值对我的绘图着色的影响。这适用于单个绘图,但在使用循环生成多个绘图并将其存储在列表中时不起作用。

这是一个最小的工作示例:

library(ggplot2)
library(scales)

data1 <- as.data.frame(cbind(x = rnorm(100),
                             y = rnorm(100),
                             v1 = rnorm(100, mean = 2, sd = 1),
                             v2 = rnorm(100, mean = -2, sd = 1)))

#add outliers
data1[1,"v1"] <- 200
data1[2,"v1"] <- -200
data1[1,"v2"] <- 50
data1[2,"v2"] <- -50

#define color palette
cols <- colorRampPalette(c("#3540FF","black","#FF3535"))(n = 100)

#simple color scale
col2 <- scale_color_gradient2(low = "#3540FF",
                              mid = "black",
                              high = "#FF3535"
                              )

#outlier-adjusted color scale
{
    aa <- min(data1$v1)
    bb <- quantile(data1$v1, 0.05)
    cc <- quantile(data1$v1, 0.95)
    dd <- max(data1$v1)

    coln <- scale_color_gradientn(colors = cols[c(1,5,95,100)],
               values = rescale(c(aa,bb,cc,dd),
                    limits = c(aa,dd))
                                                                 )
}

图:

1。用简单尺度绘制图 - 异常值会导致尺度伸展。

ggplot(data1, aes(x = x, y = y, color = v1))+
   geom_point()+
   col2

Plot with simple scales - outliers cause scales to stretch out

2。绘制具有异常值调整的比例 - 正确的颜色缩放。

ggplot(data1, aes(x = x, y = y, color = v1))+
    geom_point()+
    coln

Plot with outlier-adjusted scales - correct color scaling

3。由于数据不同,v1的比例对v2不起作用。

ggplot(data1, aes(x = x, y = y, color = v2))+
    geom_point()+
    coln

The scales for v1 do not work for v2 as the data is different

#loop to produce list of plots each with own scale
{
    plots <- list()
    k <- 1
    for (i in c("v1","v2")){
        aa <- min(data1[,i])
        bb <- quantile(data1[,i],0.05)
        cc <- quantile(data1[,i], 0.95)
        dd <- max(data1[,i])

        colm <- scale_color_gradientn(colors = cols[c(1,5,95,100)],
                     values = rescale(c(aa,bb,cc,dd),
                         limits = c(aa,dd)))

        plots[[k]] <- ggplot(data1, aes_string(x = "x",
                                               y = "y",
                                                   color = i
                                                   ))+
                     geom_point()+
                     colm

        k <- k + 1
    }
}

4。第一个情节有不正确的尺度。

plots[[1]]

First plot has the wrong scales

5。第二个图具有正确的比例。

plots[[2]]

Second plot has the correct scales

所以我猜这与绘图时调用的scale_color_gradientn()函数有关,而不是在循环内。

如果有人可以提供帮助,我们将不胜感激。在基础R中,我会将连续数据分类并将十六进制颜色分配到用于填充颜色的向量中,但我不确定如何在ggplot中应用它。

1 个答案:

答案 0 :(得分:1)

您需要使用闭包(具有相关环境的函数):

{
  plots <- list()
  k <- 1
  for (i in c("v1", "v2")){
    colm <- function() {
      aa <- min(data1[, i])
      bb <- quantile(data1[, i], 0.05)
      cc <- quantile(data1[, i], 0.95)
      dd <- max(data1[, i])

      scale_color_gradientn(colors = cols[c(1, 5, 95, 100)],
                            values = rescale(c(aa, bb, cc, dd),
                            limits = c(aa, dd)))
    }

    plots[[k]] <- ggplot(data1, aes_string(x = "x",
                                           y = "y",
                                           color = i)) +
                    geom_point() +
                    colm()
    k <- k + 1
  }
}

plots[[1]]

enter image description here

plots[[2]]

enter image description here