使用融合/强制转换创建百分比而不是总和

时间:2012-05-09 12:43:18

标签: r

简单的例子。我想使用cast / melt而不是sums来创建百分比数据框。

实施例

eg <- data.frame(
Time = factor(c(1,2,1,2)), 
A1 = c(0, 0, 1, 1), 
A2 = c(1, 1, 1, 1), 
B1 = c(0, 0, 0, 0)
)

eg.m <- melt(eg,id="Time")
eg.c <- cast(eg.m,Time ~ variable, sum, margins="grand_row")

在上面的例子中,我可以产生总和和总数。而不是产生总和,是否有一种方法可以在每个单元格中产生百分比,即cell / gran_row的总和?我知道我可以使用ddply和reshape在这里做一些事情,但想知道是否有更优雅的解决方案。

以下是我正在寻找的一个例子:

  Time  A1  A2  B1
1    1 0.5 0.5   0
2    2 1.0 1.0   0

1 个答案:

答案 0 :(得分:3)

我似乎很难避免两步这样做。问题是你想在dcast操作的输出上运行cumsum / sum函数,除非我误解了你想要的东西。

首先就是你拥有它:

eg.c <- dcast(eg.m,Time ~ variable, sum )

其次是将cumsum / sum函数应用于列:

japply(eg.c, sapply(eg.c, is.numeric ), function(x) cumsum(x)/sum(x) )

  Time  A1  A2  B1
1    1 0.5 0.5 NaN
2    2 1.0 1.0 NaN

japply是我在.RProfile中的函数:

# Takes a data.frame and returns a data.frame with only the specified columns transformed
japply <- function(df, sel, FUN=function(x) x, ...) {
  df[,sel] <- sapply( df[,sel], FUN, ... )
  df
}