Question

我想计算＆＃34; skada＆＃34;中数据的均值和标准偏差。依赖于其他三列的列。我的表格如下：

＆＃34; geografi＆＃34;列具有分类变量： SV，NV，M，SO，SV

＆＃34; gradering＆＃34;列具有分类变量： 1,2

＆＃34; plats＆＃34;列具有分类变量： 20m，kant

换句话说，这意味着我将得到SV的平均值和标准偏差，1,20m; SV，2,20m; SV，1，康得; SV，2，康德; NV，1,20m，......等等。有没有人有关于如何轻松做到这一点的任何提示？

干杯！

Answer 1

您可以使用data.table：

library(data.table) 

setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)), 
                 by = c("geografi", "gardering", "plats")]

或dyplr：

library(dplyr)

data %>% 
    group_by(geografi, gardering, plats) %>% 
    summarise(skada_mean = mean(value), skada_sd = sd(value))