使用ggpairs创建此图

时间:2014-02-12 01:02:54

标签: r ggplot2 correlation ggally

我在Shiny应用程序中有一些代码可以生成下面的第一个图表。如您所见,字体大小随相关系数的大小而变化。我想用ggpairs(GGally)或ggplot2生成类似的东西。下面的第二张图片是使用以下代码生成的:

library(GGally)
ggpairs(df, 
  upper = list(params = c(size = 10)),
  lower = list(continuous = "smooth", params = c(method = "loess", fill = "blue"))
)

正如您所看到的,相关字体的大小可以使用大小调整,但是当我设置大小的矢量时,只使用第一个值。我还想删除'Corr:'并添加一个重要指标。使用颜色作为相关系数的符号也很不错。在较低的位置,methodfill未与smooth相关联。关于如何让第二个绘图捕获第一个更多功能的任何建议都会很棒。

Anscombe's data

df <- structure(list(y1 = c(8.04, 6.95, 7.58, 8.81, 8.33, 9.96, 7.24, 
4.26, 10.84, 4.82, 5.68), x1 = c(10L, 8L, 13L, 9L, 11L, 14L, 
6L, 4L, 12L, 7L, 5L), y2 = c(9.14, 8.14, 8.74, 8.77, 9.26, 8.1, 
6.13, 3.1, 9.13, 7.26, 4.74), x2 = c(10L, 8L, 13L, 9L, 11L, 14L, 
6L, 4L, 12L, 7L, 5L), y3 = c(7.46, 6.77, 12.74, 7.11, 7.81, 8.84, 
6.08, 5.39, 8.15, 6.42, 5.73), x3 = c(10L, 8L, 13L, 9L, 11L, 
14L, 6L, 4L, 12L, 7L, 5L)), .Names = c("y1", "x1", "y2", "x2", 
"y3", "x3"), class = "data.frame", row.names = c(NA, -11L))

correlation plot using pairs

# based mostly on http://gallery.r-enthusiasts.com/RGraphGallery.php?graph=137
panel.plot <- function(x, y) {
    usr <- par("usr"); on.exit(par(usr))
    par(usr = c(0, 1, 0, 1))
    ct <- cor.test(x,y)
    sig <- symnum(ct$p.value, corr = FALSE, na = FALSE,
                  cutpoints = c(0, 0.001, 0.01, 0.05, 0.1, 1),
                  symbols = c("***", "**", "*", ".", " "))
    r <- ct$estimate
    rt <- format(r, digits=2)[1]
    cex <- 0.5/strwidth(rt)

    text(.5, .5, rt, cex=cex * abs(r))
    text(.8, .8, sig, cex=cex, col='blue')
}
panel.smooth <- function (x, y) {
      points(x, y)
      abline(lm(y~x), col="red")
      lines(stats::lowess(y~x), col="blue")
}
pairs(df, lower.panel=panel.smooth, upper.panel=panel.plot)

correlation plot using ggpairs

1 个答案:

答案 0 :(得分:12)

编辑GGally 1.0.1

由于params现已弃用,请使用wrap,如下所示:

ggpairs(df[, 1:2], 
        upper = list(continuous = wrap("cor", size = 10)), 
        lower = list(continuous = "smooth"))

enter image description here

原始答案

通过参数列表并不总是可以自定义复杂的图。这很自然:要记住太多参数。因此唯一可靠的选择是修改源。当项目为hosted on github时,这尤其令人愉快。

这是一个简单的修改,以forked repo开头。更新代码并生成下图的最简单方法是将函数ggally_cor复制并粘贴到全局环境中,然后覆盖GGally命名空间中的相同函数:

# ggally_cor <- <...>
assignInNamespace("ggally_cor", ggally_cor, "GGally")
ggpairs(df[, 1:2], 
        upper = list(params = c(size = 10)), 
        lower = list(continuous = "smooth"))

enter image description here

我删除了文字标签并添加了显着性指标。但是,修改颜色和大小并不容易,因为这些是先前映射的。我仍然在考虑这个问题,但是你明白这个想法,可能继续进行进一步的自定义。

编辑:我已更新代码,请参阅我的最新提交。它现在将标签的大小映射到相关的绝对值。如果你想要不同的颜色,你可以做类似的事情,虽然我认为这可能不是一个好主意。

enter image description here