R熔化并聚集

时间:2014-05-22 14:07:34

标签: r aggregation

我有类型的数据:

    sample   X   Y   Z
    A
    B
    A
    C
    ...

当存在A,B和C的多个测量值并且每个测量值由一些参数x,y,z等表征时

我想获得每个样本的x,y,z的平均值和平均值 像这样

    sample   variable   Avg      SE
    A         x       mean(x)   ... 
    A         y       mean(y)   ... 
    A         z       mean(z)   ... 
    ...

1 个答案:

答案 0 :(得分:0)

如何使用dplyr?您可以根据所需的任何组分析数据,然后返回汇总结果。

mydf <- data.frame(sample = sample(LETTERS[1:4], size = 100, replace = TRUE), 
                   variable = runif(100))

library(dplyr)
mydf %.% group_by(sample) %.% 
  summarize(mean = mean(variable), 
            sd = sd(variable), 
            se = mean(variable) + (sd/sqrt(n())))

Source: local data frame [4 x 4]

  sample      mean        sd        se
1      A 0.4666366 0.2705698 0.5218665
2      B 0.4128302 0.2710152 0.4615059
3      C 0.5055496 0.2569661 0.5616242
4      D 0.5132356 0.2795494 0.5702984