与ggplot汇总/总和

时间:2012-06-27 09:50:17

标签: r ggplot2

有没有办法将数据与ggplot2相加?

我想制作一个气泡图,其大小取决于z的总和。

目前我正在做类似

的事情
dd <- ddply(d, .(x,y), transform, z=sum(z))
qplot(x,y, data=dd, size=z)

但我觉得我两次写同样的东西,我希望能够写一些东西

qplot(x,y, data=dd, size=sum(z))

我查看了stat_sumstat_summmary,但我不确定它们是否合适。

是否可以使用ggplot2?如果没有,那么写出这两行的最佳方法是什么。

2 个答案:

答案 0 :(得分:7)

可以使用ggplot2中的stat_sum来完成。默认情况下,点大小表示比例。要获得点大小来表示计数,请使用size = ..n..作为美学。第三个变量的计数(和比例)可以通过第三个变量(weight = cost)加权作为美学来获得。一些例子,但首先是一些数据。

library(ggplot2)
set.seed = 321
# Generate somme data
df <- expand.grid(x = seq(1:5), y = seq(1:5), KEEP.OUT.ATTRS = FALSE)
df$Count = sample(1:25, 25, replace = F)
library(plyr)
new <- dlply(df, .(Count), function(data) matrix(rep(matrix(c(data$x, data$y), ncol = 2), data$Count), byrow = TRUE, ncol = 2))
df2 <- data.frame(do.call(rbind, new))
df2$cost <- 1:325

数据包含根据两个因素分类的单位:X1和X2;以及第三个变量,即每个单位的成本。

图1:绘制每个X1-X2组合的比例元素。 group=1告诉ggplot计算数据框中单位总数的比例。

ggplot(df2, aes(factor(X1), factor(X2))) + 
  stat_sum(aes(group = 1))

enter image description here

图2:绘制每个X1-X2组合的数量元素。

ggplot(df2, aes(factor(X1), factor(X2))) + 
  stat_sum(aes(size = ..n..))

enter image description here

图3:绘制每个X1 - X2组合元素的成本,即第三个变量的weight

ggplot(df2, aes(x=factor(X1), y=factor(X2))) + 
     stat_sum(aes(group = 1, weight = cost, size = ..n..)) 

enter image description here

图4:绘制每个X1 - X2组合中数据框中所有元素总成本的比例

ggplot(df2, aes(x=factor(X1), y=factor(X2))) + 
     stat_sum(aes(group = 1, weight = cost)) 

enter image description here

图5:绘制比例,但不是数据框中所有元素的总成本中的比例,该比例超出了每个X1类别中元素的成本。也就是说,在每个X1类别中,X2单位的主要成本在哪里出现?

ggplot(df2, aes(x=factor(X1), y=factor(X2))) + 
     stat_sum(aes(group = X1, weight = cost)) 

enter image description here

答案 1 :(得分:2)

您可以将ddply来电置于qplot

d <- data.frame(x=1:10, y=1:10, z= runif(100))
qplot(x, y, data=ddply(d, .(x,y), transform, z=sum(z)), size=z)

或使用data.table包。

DT <- data.table(d, key='x,y')
qplot(x, y, data=DT[, sum(z), by='x,y'], size=V1)