使用purrr和ggplot创建残差图矩阵

时间:2017-09-12 04:10:21

标签: r ggplot2 purrr

假设我有以下数据框:

library(tidyverse)
fit <- lm(speed ~ dist, data = cars)
select(broom::augment(fit), .fitted:.std.resid) -> dt
names(dt) <- substring(names(dt), 2)

我想使用purrr创建残差图的网格。例如,到目前为止,我有2个诊断图的公式:

    residual <- function(model) {ggplot(model, aes(fitted, resid)) +
                                  geom_point() +
                                  geom_hline(yintercept = 0) +
                                  geom_smooth(se = FALSE)}

stdResidual <- function(model) {ggplot(model, aes(fitted, std.resid)) +
                                    geom_point() +
                                    geom_hline(yintercept = 0) +
                                    geom_smooth(se = FALSE)}

我将公式存储在我计划针对强化数据集dt运行的列表中。

formulas <- tibble(charts = list(residual, stdResidual))
# A tibble: 2 x 1
  charts
  <list>
1  <fun>
2  <fun>

现在我需要将dt传递给chart中列formulas的每个元素。我实际上也试图使用gridExtra组合两者,但是现在如果我至少可以渲染它们,我会感到满意。我想我应该运行像

这样的东西
pwalk(list(dt, formulas), ???)

但是我不知道我应该在???中使用什么函数来渲染图。

1 个答案:

答案 0 :(得分:6)

设置函数来绘制每个函数,就像你上面一样:

diagplot_resid <- function(df) {
  ggplot(df, aes(.fitted, .resid)) +
    geom_hline(yintercept = 0) +
    geom_point() +
    geom_smooth(se = F) +
    labs(x = "Fitted", y = "Residuals")
}

diagplot_stdres <- function(df) {
  ggplot(df, aes(.fitted, sqrt(.std.resid))) +
    geom_hline(yintercept = 0) +
    geom_point() +
    geom_smooth(se = F) +
    labs(x = "Fitted", y = expression(sqrt("Standardized residuals")))
}

diagplot_qq <- function(df) {
  ggplot(df, aes(sample = .std.resid)) +
    geom_abline(slope = 1, intercept = 0, color = "black") +
    stat_qq() +
    labs(x = "Theoretical quantiles", y = "Standardized residuals")
}

然后在列表中调用每个,数据帧作为第二个参数。在这里,您{{}} {{}}一个函数列表,并将它们并行应用于函数参数列表。由于第二个列表中只有一个元素,invoke遍历它们。

invoke_map

enter image description here