我正在使用ggplot
显示一系列带有stat_summary_hex
图层的底图,以显示人口的净变化。要重新调整scale_fill_gradientn
的值,我需要知道min
生成的max
和..value..
stat_summary_hex
。
这是一个简化的例子:
Hex_Summary <- stat_summary_hex(aes(x = Lon, y = Lat, z = Churn),
bins=100, colour = NA, geom = "hex", fun = function(x) sum(x))
我已尝试以下方法来获取函数fun
生成的最小值和最大值:
PlotEnv <- ggplot() + HexSummary
PlotData <-ggplot_build(PlotEnv)
BinnedValues <- PlotData[["data"]][[1]]$value
BinMin <- min(BinnedValues)
BinMax <- max(BinnedValues)
但是,ggplot_build
我能够访问的数据(PlotData[["data"]][[1]]$value
)与实际情节中的值不匹配。
Per Henrik的评论:当我在剧情中添加geom_text时,
hexlab <- stat_summary_hex(geom="text",
aes(x = Lon, y = Lat, z = Churn, label=..value..), size = 1, color="black",
fun = function(x) (sum(x)))
我可以看到装箱六边形的最大值是79;但是,当我做的时候
PlotData[["data"]][[1]]$value
我假设是绘图背后的数据,我看到最大值只有29.此外,PlotData[["data"]][[1]]
中的行数不等于绘制的六边形数量。看起来使用ggplot_build不是查看分箱函数结果的合法方式。
通常,有一种更好的方式来访问具有stat_summary_hex
函数的所有坐标和值的数据框。或者,有没有一种方法可以简单地确定stat_summary_hex
语句中函数产生的最小值和最大值?
编辑:在回去记录究竟有什么不同之后,我找到了原因:我的实际功能比给出的第一个例子更复杂:
stat_summary_hex(aes(x = Lon, y = Lat, z = Churn),
bins=100, colour = NA, geom = "hex", drop = TRUE,
fun = function(x) if(abs(sum(x)) > 5) {sum(x)} else {NA})
为什么这会影响其他十六进制位置的总和。例如。在总和应为79的给定单元格中,ggplot_build
的最大值为29,但是当更改函数并设置drop = F
时,我看到预期值为79.