如何为此热图创建矩阵?

时间:2011-10-07 20:32:43

标签: r

我有

Person,Messages
Dave,8
James,6
Dave,6
Dave,8
Dave,8
John,5
John,5
John,20
Dave,0
....

我想创建一个热图,其中显示所有玩家的每条消息的消息密度。我想在x轴上将它限制为0-14个消息值(换句话说,我关心John有20个它应该影响整体密度,但我不在乎看到20个列在x轴上,因为它不经常发生)。玩家姓名位于y轴上。我该怎么做呢?如果这没有意义,请告诉我。

1 个答案:

答案 0 :(得分:5)

如果我理解正确,如果您愿意使用geom_tile中的ggplot2,则可能根本无需将数据转换为矩阵:

dat <- read.table(textConnection("Person,Messages
Dave,8
James,6
Dave,6
Dave,8
Dave,8
John,5
John,5
John,20
Dave,0"),sep = ",",header = TRUE)


dat <- ddply(dat,.(Person,Messages),summarise,val = length(Person))
ggplot(dat,aes(x = Messages, y = Person, fill = val)) + 
        geom_tile()

enter image description here

或者这是一个有点费力的完整矩阵路由,你可以在image中用作输入,假设我们从dat中的原始数据开始:

#Some data to pad with the missing combinations
pad <- expand.grid(unique(dat$Person),
                    min(dat$Messages):max(dat$Messages))
colnames(pad) <- c('Person','Messages')

#Aggregate the data and merge with pad data
dat <- ddply(dat,.(Person,Messages),summarise,val = length(Person))
tmp <- merge(dat,pad,all.y = TRUE)

#Convert from long to wide
rs <- cast(tmp,Person~Messages,value = 'val')

#Clean up the result
rownames(rs) <- rs$Person
rs <- rs[,-1]
rs[is.na(rs)] <- 0

> rs
      0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Dave  1 0 0 0 0 0 1 0 3 0  0  0  0  0  0  0  0  0  0  0  0
James 0 0 0 0 0 0 1 0 0 0  0  0  0  0  0  0  0  0  0  0  0
John  0 0 0 0 0 2 0 0 0 0  0  0  0  0  0  0  0  0  0  0  1