我对标准偏差的计算有点困惑,如果你能给我一些关于下面2个问题的帮助,那就太棒了。
Day Drink People
1 Coffee 1
1 Coffee 3
1 Tea 5
1 Tea 4
1 Mint 7
1 Mint 5
2 Coffee 1
2 Coffee 3
2 Tea 4
2 Tea 8
2 Mint 9
2 Mint 3
3 Coffee 2
3 Coffee 4
3 Tea 5
3 Tea 3
3 Mint 2
3 Mint 2
代码&输出:
t <- aggregate(People ~ Day + Drink, data=t, mean)
Day Drink People
1 Coffee 2
1 Tea 5
1 Mint 6
2 Coffee 2
2 Tea 6
2 Mint 6
3 Coffee 3
3 Tea 4
3 Mint 2
问题1:我如何计算标准错误(意思的标准偏差)?
代码&amp;输出:
t <- transform(t, AccPeople = ave(People, Drink, FUN=cumsum))
Day Drink People Acc People
1 Coffee 2 2
1 Tea 5 5
1 Mint 6 6
2 Coffee 2 4
2 Tea 6 11
2 Mint 6 12
3 Coffee 3 7
3 Tea 4 15
3 Mint 2 14
问题2:我如何计算累积的标准偏差呢?
非常感谢!! (并抱歉数据格式错误!)
答案 0 :(得分:2)
您可以使用ddply
包中的plyr
:
library(plyr)
计算平均值和标准误差(和标准差):
dat2 <- ddply(dat, .(Day, Drink), summarise,
M = mean(People), SE = sd(People) / sqrt((length(People))),
SD = sd(People))
其中dat
是数据框的名称。
计算累计平均值和累计标准差:
ddply(dat2, .(Drink), mutate,
Macc = cumsum(M), SDacc = cumsum(SD))