我想计算" skada"中数据的均值和标准偏差。依赖于其他三列的列。我的表格如下:
" geografi"列具有分类变量: SV,NV,M,SO,SV
" gradering"列具有分类变量: 1,2
" plats"列具有分类变量: 20m,kant
换句话说,这意味着我将得到SV的平均值和标准偏差,1,20m; SV,2,20m; SV,1,康得; SV,2,康德; NV,1,20m,......等等。有没有人有关于如何轻松做到这一点的任何提示?
干杯!
答案 0 :(得分:1)
您可以使用data.table:
library(data.table)
setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)),
by = c("geografi", "gardering", "plats")]
或dyplr:
library(dplyr)
data %>%
group_by(geografi, gardering, plats) %>%
summarise(skada_mean = mean(value), skada_sd = sd(value))