Question

例如，我想将颜色映射到z，将0映射映射到“白色”。

> a <- data.frame(x=1:10, y=1, z=c(rnorm(8),-12,12))
> a
    x y           z
1   1 1  -0.4603911
2   2 1  -0.4868471
3   3 1   0.2180346
4   4 1  -0.8807652
5   5 1   1.7379462
6   6 1  -0.1334904
7   7 1  -0.3675578
8   8 1   0.9225425
9   9 1 -12.0000000
10 10 1  12.0000000

ggplot(a,aes(x=x,y=y,fill=z)) + geom_bar(stat="identity") + 
  scale_fill_gradient2(high="green", mid="white", low="red")

正如你所看到的那样，颜色并不是真正有用的指标，而不是传达关于值如何分布的一般概念，现在颜色只告诉哪些值是极端的，留下大多数值无法区分未经训练的眼睛。

有一种方法Non-linear color distribution over the range of values in a geom_raster，但它似乎有点复杂，我只能模糊地理解它是如何工作的。

enter image description here

然后我想也许order是一种很好的重新缩放方式，因此：

ggplot(a,aes(x=x,y=y,fill=ecdf(z)(z))) + geom_bar(stat="identity") +
scale_fill_gradient2(high="green", mid="white", low="red", midpoint=ecdf(a$z)(0))

它在某种程度上起了作用（这里我使用ecdf而不是order来查找重新调整的值0。但是，缺点是，我想将图例的标签保留为未缩放的值，而不是重新缩放的值。所以类似于labels=function(x) quantile(a$z, x)，我无法使其工作。而且，我发现重复使用ecdf和quantile向前和向后重新缩放是愚蠢的

在这些情况下是否有更好或更简单的方法，例如强大的（不需要是最佳的或非常准确的）足以为各种映射值分布填充合理的颜色。

enter image description here

Answer 1

我知道并不是一种简单的方法，但您可以使用scale_fill_gradientn完全控制映射。关键是将颜色映射到0-1范围内的值，其中0是最小值，1是最大值。这是一个选项：

library(ggplot2)
a <- data.frame(x=1:10, y=1, z=c(rnorm(8),-12,12))
get_col <- colorRamp(c("red", "white", "green"))  # make fun to interpolate colors
quantiles <- (0:6) / 6                            # how many quantiles we want to map 
quantile.vals <- quantile(a$z, quantiles, names=F)# the values for each quantile
colours <- rgb(get_col(quantiles), max=255)       # 7 evenly interpolated colors 
val.remap <- (quantile.vals - min(a$z)) / 
  diff(range(a$z))                                # The values corresponding to the quantiles

ggplot(a, aes(x=x,y=y,fill=z)) + 
  geom_bar(stat="identity") +
  scale_fill_gradientn(
    colours=colours,
    values=val.remap,
    breaks=quantile.vals,# Necessary to get legend values spread appropriately
    guide="legend")      # Necessary to get legend values spread appropriately

在这里，我们选择根据值的分布将均匀插值的颜色分配给值。因此，如果值范围对应于分布的大部分，即使它实际跨越最小 - 最大范围的相对较小部分，它将获得更多颜色分配。

如果要将特定颜色指定为零，可以通过编辑与colours，values和breaks参数对应的向量来实现。如果您具有高于和低于零的相同数量的值，则这可以是微不足道的，如果不是则烦人。

版本w / 0设置为白色：

library(ggplot2)
a <- data.frame(x=1:10, y=1, z=c(rnorm(8), -12, 12))
splits <- 7     # should be odd number
mid.point <- 0
pos.vals <- a$z[a$z > mid.point]
neg.vals <- a$z[a$z < mid.point]
pos.quants <- quantile(c(mid.point, pos.vals), 0:((splits - 1) / 2) / ((splits - 1) / 2), names=F)
neg.quants <- quantile(c(mid.point, neg.vals), 0:((splits - 1) / 2) / ((splits - 1) / 2), names=F)
quants <- c(neg.quants, pos.quants[-1])  # drop of the mid-point from pos.quants since otherwise double counted

get_col <- colorRamp(c("red", "white", "green"))  # make fun to interpolate colors
colours <- rgb(get_col(0:(splits - 1)/(splits - 1)), max=255)       # 7 evenly interpolated colors 
val.remap <- (quants - min(quants)) / 
  diff(range(quants))                                # The values corresponding to the quantiles

ggplot(a, aes(x=x,y=y,fill=z)) + 
  geom_bar(stat="identity") +
  scale_fill_gradientn(
    colours=colours,
    values=val.remap,
    breaks=quants,
    guide="legend")

color mapping result http://i42.tinypic.com/qzmzgn.png

使用scale_fill_gradient时处理极值/分布的其他方法？

1 个答案: