如何使用ddply将列添加到数据框?

时间:2011-09-27 17:20:24

标签: r plyr

我有一个如下所示的数据框:

site   date  var   dil
   1    A    7.4   2 
   2    A    6.5   2
   1    A    7.3   3
   2    A    7.3   3
   1    B    7.1   1
   2    B    7.7   2
   1    B    7.7   3
   2    B    7.4   3

我需要在此数据框中添加一个名为wt的列,其中包含计算加权平均值所需的加权因子。必须为sitedate的每个组合导出此加权因子。

我正在使用的方法是首先构建一个计算weigthing因子的函数:

> weight <- function(dil){
                    dil/sum(dil)
                     }

然后为sitedate

的每个组合应用函数
> df$wt <- ddply(df,.(date,site),.fun=weight)

但我收到此错误消息:

Error in FUN(X[[1L]], ...) : 
  only defined on a data frame with all numeric variables

1 个答案:

答案 0 :(得分:16)

你快到了。修改代码以使用transform函数。这允许您将列添加到ddply

中的data.frame
weight <- function(x) x/sum(x)

ddply(df, .(date,site), transform, weight=weight(dil))

  site date var dil weight
1    1    A 7.4   2   0.40
2    1    A 7.3   3   0.60
3    2    A 6.5   2   0.40
4    2    A 7.3   3   0.60
5    1    B 7.1   1   0.25
6    1    B 7.7   3   0.75
7    2    B 7.7   2   0.40
8    2    B 7.4   3   0.60