如何解释corrplot的输出?

时间:2014-06-19 04:28:02

标签: r plot statistics data-visualization r-corrplot

corrplot软件包提供了一些简洁的图表和带有示例的文档。

但我不明白输出。我可以看到,如果你有一个矩阵A_ij,你可以将其绘制为n n方块的排列方式,其中tile ij的颜色对应于值A_ij。但是一些例子似乎有更多的维度:

enter image description here

这里我们可以猜测该颜色显示相关系数,椭圆的方向是负/正相关。什么是怪癖?

method的{​​{3}}说:

  

要使用的相关矩阵的可视化方法。目前,它支持七种方法,名为“圆”(默认),“方形”,“椭圆”,“数字”,“饼”,“阴影”和“颜色”。有关详细信息,请参阅示例。

     

圆形或正方形的区域表示相应相关系数的绝对值。方法“馅饼”和“阴影”来自Michael Friendly的工作(对阴影添加了一些调整),“椭圆”来自D.J.默多克和E.D.周的工作,见参考文献部分。

所以我们知道圆形和正方形的区域应该显示系数。那么其他维度和其他方法呢?

2 个答案:

答案 0 :(得分:6)

图中只显示了一个维度。

迈克尔友好, Corrgrams:相关矩阵的探索性显示corrplot文档令人困惑地将此称为他的工作"),说:

  

在阴影行中,每个单元格根据相关性的符号以蓝色或红色阴影显示,并且颜色强度与相关性的大小成比例地缩放0-100%。 (使用从红色,(1,0,0),白色(1,1,1)到蓝色(0,0,1)的RGB编码可以很容易地计算出这种缩放颜色。为简单起见,我们忽略了非线性颜色再现和感知,但请注意,这些很容易适应颜色映射功能。)添加白色对角线,使得相关的方向仍然可以在黑白中辨别。选择这种双极性颜色标度以使相关性接近0空(白色),并使得相等幅度的正值和负值近似同样强烈地着色。我们的软件(第6节)中实现了灰度和其他颜色方案,但这里没有说明。

     

条形和圆形符号也使用相同的缩放颜色,但填充与相关的绝对值成比例的区域。对于条形图,负值从底部填充,正值从顶部填充。圆圈顺时针填充正值,逆时针填充负值。 椭圆的偏心率参数化地缩放到相关值(Murdoch和Chow,1996)。感觉上,随着相关幅度的增加,它们具有视觉上不那么突出的特性。字形。

(强调我的)

enter image description here

" Murdoch and Chow,1996"是一个描述绘制椭圆的方程式的出版物(大型相关矩阵的图形显示)。省略号显然是双变量正态分布的漫画:

enter image description here

总而言之,所显示的唯一维度始终是相关系数(或A_ij的值,以使用问题的术语)本身。多个表观尺寸是多余的。

答案 1 :(得分:5)

我认为该情节非常自我解释。在右侧,您有scale从红色(负相关)到蓝色(正相关)的颜色。根据相关强度,颜色遵循渐变。

如果椭圆向右倾斜,则它再次为正相关,如果它向左倾斜,则为负相关。

线周围的扩散(表示完全相关,例如mpg~mpg)会产生椭圆。对于较低的相关强度,您将有一个更加扩散的椭圆。这通常是一个弱相关关系在散点图中的样子。然而,我认为这些是漫画。

以下是负责绘制省略号的corrplot函数的一些代码。我不打算解释这个(因为它是更大系统的一部分)。如果你想深入了解它,我想表明逻辑就在那里:

if (method == "ellipse" & plotCI == "n") {
    ell.dat <- function(rho, length = 99) {
        k <- seq(0, 2 * pi, length = length)
        x <- cos(k + acos(rho)/2)/2
        y <- cos(k - acos(rho)/2)/2
        return(cbind(rbind(x, y), c(NA, NA)))
    }
    ELL.dat <- lapply(DAT, ell.dat)
    ELL.dat2 <- 0.85 * matrix(unlist(ELL.dat), ncol = 2, 
        byrow = TRUE)
    ELL.dat2 <- ELL.dat2 + Pos[rep(1:length(DAT), each = 100), 
        ]
    polygon(ELL.dat2, border = col.border, col = col.fill)
}