以编程方式在scale_fill_manual ggplot调用中指定颜色

时间:2012-04-22 11:35:07

标签: r ggplot2

我想根据特定列中给出的值为ggplot2 facet图的背景着色。使用我已经问过的先前问题的答案,我能够将我需要的东西拼凑在一起。 @joran对this问题的回答特别有用,因为它说明了创建一个单独的数据框以传递给ggplot的技术。

这一切都运行得很好,给出了如下图所示的输出: facets coloured by region

以下是我用于生成上述情节的代码:

# User-defined variables go here

list_of_names <- c('aa','bb','cc','dd','ee','ff')
list_of_regions <- c('europe','north america','europe','asia','asia','japan')

# Libraries

require(ggplot2)
require(reshape)

# Create random data with meaningless column names
set.seed(123)
myrows <- 30
mydf <- data.frame(date = seq(as.Date('2012-01-01'), by = "day", length.out = myrows),
                   aa = runif(myrows, min=1, max=2),
                   bb = runif(myrows, min=1, max=2),
                   cc = runif(myrows, min=1, max=2),
                   dd = runif(myrows, min=1, max=2),
                   ee = runif(myrows, min=1, max=2),
                   ff = runif(myrows, min=1, max=2))

# Transform data frame from wide to long

mydf <- melt(mydf, id = c('date'))
mydf$region <- as.character("unassigned")

# Assign regional label

for (ii in seq_along(mydf$date)) {
    for (jj in seq_along(list_of_names)) {
        if(as.character(mydf[ii,2]) == list_of_names[jj]) {mydf$region[ii] <- as.character(list_of_regions[jj])}
    }
}

# Create data frame to pass to ggplot for facet colours
mysubset <- unique(mydf[,c('variable','region')])
mysubset$value <- median(mydf$value) # a dummy value but one within the range used in the data frame
mysubset$date <- as.Date(mydf$date[1]) # a dummy date within the range used

# ... And plot
p1 <- ggplot(mydf, aes(y = value, x = date, group = variable)) +
    geom_rect(data = mysubset, aes(fill = region), xmin = -Inf, xmax = Inf, ymin = -Inf, ymax = Inf, alpha = 0.3) +
    scale_fill_manual(values = c("japan" = "red", "north america" = "green", "asia" = "orange", "europe" = "blue")) +
    geom_line() +
    facet_wrap( ~ variable, ncol = 2)

print (p1)

我正在使用的真实世界脚本旨在用于包含许多不同数据系列的许多不同组,因此这个脚本将被复制多次,只有变量发生变化。

这使得用户定义的元素可以清晰地进行编辑非常重要,这就是list_of_nameslist_of_regions变量放在文件开头的原因。 (当然,最好不需要更改脚本,而是将这些列表定义为外部文件或将它们作为参数传递给脚本。)我试图通过使用这两个for来概括解决方案。循环以分配区域。我试图用apply函数试图获得一个更加以R为中心的解决方案,但是无法让它工作,所以我放弃并坚持我所知道的。

但是,在我的代码中,scale_fill_manual调用需要显式传递变量以定义填充颜色,例如'europe' = 'blue'。这些变量将根据我正在处理的数据而有所不同,因此对于当前形式的脚本,我需要为每组数据系列手动编辑脚本的ggplot部分。我知道这将是耗时的,我强烈怀疑它也很容易出错。

问。理想情况下,我希望能够以编程方式从先前声明的值列表(在此情况下来自scale_fill_manual)中提取并定义list_of_regions调用所需的值,以匹配先前声明的颜色列表,但我想不出有办法实现这一目标。你有什么想法吗?

1 个答案:

答案 0 :(得分:4)

这有帮助吗?

cols <- rainbow(nrow(mtcars))
mtcars$car <- rownames(mtcars)

ggplot(mtcars, aes(mpg, disp, colour = car)) + geom_point() +
  scale_colour_manual(limits = mtcars$car, values = cols) +
  guides(colour = guide_legend(ncol = 3))

enter image description here