根据其他列中的因素计算一列中R的平均值和标准偏差

时间:2017-07-28 13:26:52

标签: r multiple-columns mean calculated-columns standard-deviation

我想计算" skada"中数据的均值和标准偏差。依赖于其他三列的列。我的表格如下:enter image description here

" geografi"列具有分类变量: SV,NV,M,SO,SV

" gradering"列具有分类变量: 1,2

" plats"列具有分类变量: 20m,kant

换句话说,这意味着我将得到SV的平均值和标准偏差,1,20m; SV,2,20m; SV,1,康得; SV,2,康德; NV,1,20m,......等等。有没有人有关于如何轻松做到这一点的任何提示?

干杯!

1 个答案:

答案 0 :(得分:1)

您可以使用data.table:

library(data.table) 

setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)), 
                 by = c("geografi", "gardering", "plats")]

或dyplr:

library(dplyr)

data %>% 
    group_by(geografi, gardering, plats) %>% 
    summarise(skada_mean = mean(value), skada_sd = sd(value))