当数据中不存在所有级别的分组变量时,图表之间的颜色比例和图例保持一致

时间:2016-01-22 15:27:02

标签: r variables colors ggplot2

我有数据正在被顺序添加到R中的data.frame。我正在创建绘图,每次都经常显示结果。该图是根据某些标准进行颜色编码的,其中一些标准从未得到满足,因此图中没有这种颜色。

例如,

library(ggplot2)
dates15=seq(as.POSIXct("2015-01-01 00:00:00"), as.POSIXct("2015-06-30 23:45:00"), by="15 min")
ex.data=rnorm(length(dates15),2,1)
blue=c(1:5000)
pink=which(ex.data>50)
purple=c(10000:15000)
colours=rep("Black points", length(dates15))
colours[blue]="Blue Points"
colours[pink]="Pink points"
colours[purple]="Purple points"
all.data=data.frame(Date=dates15, Data=ex.data, Colours=colours)
g.cols=c("black", "blue", "pink", "purple")
ggplot(all.data, aes(Date, Data, colour=Colours, group=1))+geom_line()+scale_color_manual(values=g.cols)+
  xlim(as.POSIXct("2015-01-01 00:00:00"), as.POSIXct("2015-02-12 23:45:00"))

在这个例子中,我将变量pink设置为仅大于50的点(这在我的数据中显然是不可能的)。因此,当创建情节时,' Pink'缺少图例名称,但粉红色已分配给紫色标签。我希望颜色和标签始终保持匹配,即使有一个不使用的变量。

1 个答案:

答案 0 :(得分:13)

设置Colours的因子级别,以包括所有可能的值,无论是否存在于当前数据中,然后将drop=FALSE添加到scale_colour_manual

all.data=data.frame(Date=dates15, Data=ex.data, Colours=colours)
g.cols=c("black", "blue", "pink", "purple")
all.data$Colours = factor(all.data$Colours, levels=sort(c(unique(colours), "Pink Points")))

ggplot(all.data, aes(Date, Data, colour=Colours, group=1)) + 
  geom_line() +
  scale_color_manual(values=g.cols, drop=FALSE) +
  xlim(as.POSIXct("2015-01-01 00:00:00"), as.POSIXct("2015-02-12 23:45:00"))