从单个矩阵创建多个单独的热图

时间:2012-10-26 16:19:51

标签: r graphics matrix data-visualization heatmap

我希望将42x42矩阵可视化为28个单独的热图,每个热图为6x6矩阵,其值显示在颜色的顶部。我只需要下半部分矩阵,我不想绘制任何被排除的东西。随后的6x6矩阵不应重叠,如下例所示:

d = as.matrix(read.table("http://dl.dropbox.com/u/2505196/matrix_posthoc_tukey.dat"))
d[upper.tri(d)] <- NA
d1 <- d[1:6, 1:6]
d2 <- d[1:6, 7:12]
d3 <- d[1:6, 13:18]
d4 <- d[1:6, 18:24]
#...etc, up to d28 <- d[37:42,37:42] 

用于创建单个热图的代码如下所示:

#baseline to create a separated space for all 28 plots
par(mfrow=c(4,7), mar=c(2,2,4,1), oma=c(2,4,2,2))

#using `image` to create heatmap, with color breaks defined by specific values
#the code below create just single heatmap
image(x=1:6, y=1:6, axes = FALSE, ylab="", xlab="", d1, 
  breaks=c(min(d1,na.rm=TRUE), -5.45, -4.65, 4.65, 5.45, max(d1,na.rm=TRUE)),
  col=c("red","orange","white","orange","red"))
axis(2, 1:6, cex.axis = 0.7, las=1, tick=F)
axis(3, 1:6, cex.axis = 0.7, tick=F)
#create vertical and forizontal lines
abline(h=seq(0.5,6.5,1), v=seq(0.5,6.5,1))
#plot values from the specific matrix subset
for (i in 1:6)
   {
     for (j in 1:6)
       {
         txt <- sprintf("%0.1f", d1[i,j])
         text(i, j, txt, cex=0.7)
        }
   }

三个这样的热图如下所示:

enter image description here

那就是我被困住的地方。每次我将另一张图片添加到我的单页多个热图集合时,我都必须手动更改d值。我不知道如何使用上面的代码创建一个漂亮的循环来同时绘制矩阵的特定子集。

ggplot2,格子的替代解决方案也受到欢迎,虽然我认为这里的主要问题是制作这一系列热图的良好循环。

3 个答案:

答案 0 :(得分:3)

这是一个非常复杂的情节,但它可以很容易地由R中的标准图形库生成。它或多或少只是跟踪哪些索引进入哪个面板。您可以自动提取d1d28矩阵的方式,这样您就不必写出每一行。

# Get the submatrices
I <- unlist(lapply(0:6, function(a) a:6))
J <- rep(0:6, 7:1)
d2 <- mapply(function(i,j) d[1:6+6*i, 1:6+6*j], I, J, SIMPLIFY=FALSE)

# Setup the layout and add an outer margin for the title and axis labels
layout(matrix(c(1:28, 0, 0), 5, 6))
par(oma=c(3,3,3,1), mar=c(2,2,1,1))

# Plot all the matrices oriented the same way they appear in text
# i.e. the first (vertical) dimension is plotted along the Y-axis
for(k in 1:length(d2)){
    x <- 1:6+6*J[k]
    y <- 1:6+6*I[k]

    # Heatmap & grid
    image(x, y, t(d2[[k]][nrow(d2[[k]]):1,]), las=1, axes=FALSE,
          breaks=c(-1e10, -5.45, -4.65, 4.65, 5.45, 1e10),
          col=c("red","orange","white","orange","red"))
    xg <- apply(!is.na(d2[[k]]), 2, sum)
    yg <- rev(apply(!is.na(d2[[k]]), 1, sum))
    segments(c(x[1]-1, x)+.5, min(y)-.5,
             c(x[1]-1, x)+.5, min(y)+c(6, yg)-.5, xpd=TRUE)
    segments(min(x)-.5,         c(y[1]-1, y)+.5,
             min(x)+c(6,xg)-.5, c(y[1]-1, y)+.5, xpd=TRUE)

    # X & Y-axis values
    mtext(x, 1, .1, at=x, cex=.5)
    mtext(rev(y), 2, .2, at=y, las=1, cex=.5)

    # Values of each cell
    text(rep(x, each=6), rep(rev(y), 6),
     sub("NA", "", sprintf("%.2f", d2[[k]])), cex=.3)
}

# Add title and axis labels
title("All 28 submatrices", outer=TRUE)
mtext("Columns", outer=TRUE, 1, 1)
mtext("Rows", outer=TRUE, 2, 1)

每个单元格中的数字可能很小,但如果您将其绘制为pdf并放大,则可以读取它们。 xpd函数的segments参数支持将剪切线条绘制到绘图区域(否则外部线条会显得更薄)。

enter image description here

答案 1 :(得分:1)

要拥有原始矩阵的6x6子阵列,您可以执行以下操作:

for (i in seq(1, 42, 6))
    for (j in seq(i, 42, 6)) {
        dsub = d[i:(i+5), j:(j+5)]
        ...
    }

但是我建议使用更好的方法来创建热图 - 而不是重新发明它。虽然我最喜欢的用于制作正常热图的包 - 正如你想要的单元格内的数字 - 是pheatmap(=漂亮的热图),但它不支持同一页面中的多个小热图。这只是pheatmap()输出的示例,您可以在安装并加载包后运行?pheatmap来查看函数的帮助。

enter image description here

要在同一页面中使用多个热图,您可以使用ggplot2包。以下是how to make ggplot2 heatmapshaving multiple plots on the same page.

的精彩手册

答案 2 :(得分:0)

我认为你只需要一个嵌套循环,你的d#必须是一个数组(我将其称为子矩阵)。请原谅我的代码,因为我不知道R,但是这样的事情:

for (row in 1:7)
  {
    for (col in 1:7)
      {
        subs[((row-1)*6)+j] <- d[ ((row-1)*6) + 1) : (row*6), (((col-1)*6) + 1) : (col*6)] 
      }
  }

这将为您提供所有49个子矩阵。如果您只想要前4列子矩阵,则可以在循环中从1:4开始。