我有
Person,Messages
Dave,8
James,6
Dave,6
Dave,8
Dave,8
John,5
John,5
John,20
Dave,0
....
我想创建一个热图,其中显示所有玩家的每条消息的消息密度。我想在x轴上将它限制为0-14个消息值(换句话说,我关心John有20个它应该影响整体密度,但我不在乎看到20个列在x轴上,因为它不经常发生)。玩家姓名位于y轴上。我该怎么做呢?如果这没有意义,请告诉我。
答案 0 :(得分:5)
如果我理解正确,如果您愿意使用geom_tile
中的ggplot2
,则可能根本无需将数据转换为矩阵:
dat <- read.table(textConnection("Person,Messages
Dave,8
James,6
Dave,6
Dave,8
Dave,8
John,5
John,5
John,20
Dave,0"),sep = ",",header = TRUE)
dat <- ddply(dat,.(Person,Messages),summarise,val = length(Person))
ggplot(dat,aes(x = Messages, y = Person, fill = val)) +
geom_tile()
或者这是一个有点费力的完整矩阵路由,你可以在image
中用作输入,假设我们从dat
中的原始数据开始:
#Some data to pad with the missing combinations
pad <- expand.grid(unique(dat$Person),
min(dat$Messages):max(dat$Messages))
colnames(pad) <- c('Person','Messages')
#Aggregate the data and merge with pad data
dat <- ddply(dat,.(Person,Messages),summarise,val = length(Person))
tmp <- merge(dat,pad,all.y = TRUE)
#Convert from long to wide
rs <- cast(tmp,Person~Messages,value = 'val')
#Clean up the result
rownames(rs) <- rs$Person
rs <- rs[,-1]
rs[is.na(rs)] <- 0
> rs
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Dave 1 0 0 0 0 0 1 0 3 0 0 0 0 0 0 0 0 0 0 0 0
James 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
John 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1