Question

我有数据正在被顺序添加到R中的data.frame。我正在创建绘图，每次都经常显示结果。该图是根据某些标准进行颜色编码的，其中一些标准从未得到满足，因此图中没有这种颜色。

例如，

library(ggplot2)
dates15=seq(as.POSIXct("2015-01-01 00:00:00"), as.POSIXct("2015-06-30 23:45:00"), by="15 min")
ex.data=rnorm(length(dates15),2,1)
blue=c(1:5000)
pink=which(ex.data>50)
purple=c(10000:15000)
colours=rep("Black points", length(dates15))
colours[blue]="Blue Points"
colours[pink]="Pink points"
colours[purple]="Purple points"
all.data=data.frame(Date=dates15, Data=ex.data, Colours=colours)
g.cols=c("black", "blue", "pink", "purple")
ggplot(all.data, aes(Date, Data, colour=Colours, group=1))+geom_line()+scale_color_manual(values=g.cols)+
  xlim(as.POSIXct("2015-01-01 00:00:00"), as.POSIXct("2015-02-12 23:45:00"))

在这个例子中，我将变量pink设置为仅大于50的点（这在我的数据中显然是不可能的）。因此，当创建情节时，＆＃39; Pink＆＃39;缺少图例名称，但粉红色已分配给紫色标签。我希望颜色和标签始终保持匹配，即使有一个不使用的变量。

Answer 1

设置Colours的因子级别，以包括所有可能的值，无论是否存在于当前数据中，然后将drop=FALSE添加到scale_colour_manual：

all.data=data.frame(Date=dates15, Data=ex.data, Colours=colours)
g.cols=c("black", "blue", "pink", "purple")
all.data$Colours = factor(all.data$Colours, levels=sort(c(unique(colours), "Pink Points")))

ggplot(all.data, aes(Date, Data, colour=Colours, group=1)) + 
  geom_line() +
  scale_color_manual(values=g.cols, drop=FALSE) +
  xlim(as.POSIXct("2015-01-01 00:00:00"), as.POSIXct("2015-02-12 23:45:00"))

当数据中不存在所有级别的分组变量时，图表之间的颜色比例和图例保持一致

1 个答案: