受Q Finding the elbow/knee in a curve的启发,我开始玩smooth.spline()
。
特别是,我想要想象参数df
(自由度)如何影响近似以及一阶和二阶导数。请注意,此Q 不关于近似值,但关于ggplot2
可视化中的特定问题(或边缘情况)。
facet_grid()
library(ggplot2)
ggplot(ap, aes(x, y)) +
geom_point(data = dp, alpha = 0.2) +
geom_line() +
facet_grid(deriv ~ df, scales = "free_y", labeller = label_both) +
theme_bw()
dp
是一个data.table,包含要求近似值的数据点,ap
是一个data.table,带有近似数据加上导数(数据如下)。
对于每一行,facet_grid()
scales = "free_y"
已选择显示所有数据的比例。不幸的是,一个面板有一些“异常值”,这使得很难在其他面板中看到细节。所以,我想“放大”。
coord_cartesian()
ggplot(ap, aes(x, y)) +
geom_point(data = dp, alpha = 0.2) +
geom_line() +
facet_grid(deriv ~ df, scales = "free_y", labeller = label_both) +
theme_bw() +
coord_cartesian(ylim = c(-200, 50))
通过手动选择的范围,可以看到第3行面板中的更多细节。但是,限制已应用于网格的所有面板。因此,在第1行中,细节几乎无法区分。
我正在寻找的方法是将coord_cartesian()
分别应用于网格的每个单独面板(或一组面板,例如行方向)。例如,之后可以操纵ggplot
对象吗?
cowplot
作为一种解决方法,我们可以使用cowplot
包创建三个单独的图并将它们组合在一起:
g0 <- ggplot(ap[deriv == 0], aes(x, y)) +
geom_point(data = dp, alpha = 0.2) +
geom_line() +
facet_grid(deriv ~ df, scales = "free_y", labeller = label_both) +
theme_bw()
g1 <- ggplot(ap[deriv == 1], aes(x, y)) +
geom_line() +
facet_grid(deriv ~ df, scales = "free_y", labeller = label_both) +
theme_bw() +
coord_cartesian(ylim = c(-50, 50))
g2 <- ggplot(ap[deriv == 2], aes(x, y)) +
geom_line() +
facet_grid(deriv ~ df, scales = "free_y", labeller = label_both) +
theme_bw() +
coord_cartesian(ylim = c(-200, 100))
cowplot::plot_grid(g0, g1, g2, ncol = 1, align = "v")
不幸的是,这个解决方案
facet_wrap()
是另类吗?我们可以使用facet_wrap()
代替facet_grid()
:
ggplot(ap, aes(x, y)) +
# geom_point(data = dp, alpha = 0.2) + # this line causes error message
geom_line() +
facet_wrap(~ deriv + df, scales = "free_y", labeller = label_both, nrow = 3) +
theme_bw()
现在,每个面板的y轴分别缩放,展示了一些面板的细节。不幸的是,我们仍然无法“放大”到右下方的面板,因为使用coord_cartesian()
会影响所有面板。
另外,该行
geom_point(data = dp, alpha = 0.2)
奇怪的原因
gList中的错误(list(x = 0.5,y = 0.5,width = 1,height = 1,just =“center”,: “gList”中只允许“grobs”
我必须将此行注释掉,因此不会显示要近似的数据点。
library(data.table)
# data points
dp <- data.table(
x = c(6.6260, 6.6234, 6.6206, 6.6008, 6.5568, 6.4953, 6.4441, 6.2186,
6.0942, 5.8833, 5.7020, 5.4361, 5.0501, 4.7440, 4.1598, 3.9318,
3.4479, 3.3462, 3.1080, 2.8468, 2.3365, 2.1574, 1.8990, 1.5644,
1.3072, 1.1579, 0.95783, 0.82376, 0.67734, 0.34578, 0.27116, 0.058285),
y = 1:32,
deriv = 0)
# approximated data points and derivatives
ap <- rbindlist(
lapply(seq(2, length(dp$x), length.out = 4),
function(df) {
rbindlist(
lapply(0:2,
function(deriv) {
result <- as.data.table(
predict(smooth.spline(dp$x, dp$y, df = df), deriv = deriv))
result[, c("df", "deriv") := list(df, deriv)]
})
)
})
)
答案 0 :(得分:1)
最新答案,但是以下骇客只是发生在我身上。会适合您的用例吗?
步骤1 。创建预期图的替代版本,限制y值的范围,以使scales = "free_y"
为每个构面行提供所需的比例范围。还要创建具有完整数据范围的预期构面图:
library(ggplot2)
library(dplyr)
# alternate plot version with truncated data range
p.alt <- ap %>%
group_by(deriv) %>%
mutate(upper = quantile(y, 0.75),
lower = quantile(y, 0.25),
IQR.multiplier = (upper - lower) * 10) %>%
ungroup() %>%
mutate(is.outlier = y < lower - IQR.multiplier | y > upper + IQR.multiplier) %>%
mutate(y = ifelse(is.outlier, NA, y)) %>%
ggplot(aes(x, y)) +
geom_point(data = dp, alpha = 0.2) +
geom_line() +
facet_grid(deriv ~ df, scales = "free_y", labeller = label_both) +
theme_bw()
# intended plot version with full data range
p <- p.alt %+% ap
第2步。使用ggplot_build()
为两个ggplot对象生成图数据。将alt版本的面板参数应用于预期版本:
p <- ggplot_build(p)
p.alt <- ggplot_build(p.alt)
p$layout$panel_params <- p.alt$layout$panel_params
rm(p.alt)
第3步。从修改后的绘图数据构建所需的绘图,并绘制结果:
p <- ggplot_gtable(p)
grid::grid.draw(p)
注意:在此示例中,我通过将所有构面行中距上/下四分位点都大于10 * IQR的所有值设置为NA来截断了数据范围。可以用定义异常值的任何其他逻辑来代替。