标准误差和标准偏差

时间:2014-02-03 16:21:26

标签: r statistics dataframe standard-deviation

我对标准偏差的计算有点困惑,如果你能给我一些关于下面2个问题的帮助,那就太棒了。

1。我的初始数据

Day Drink   People
1   Coffee  1
1   Coffee  3
1   Tea 5
1   Tea 4
1   Mint    7
1   Mint    5
2   Coffee  1
2   Coffee  3
2   Tea 4
2   Tea 8
2   Mint    9
2   Mint    3
3   Coffee  2
3   Coffee  4
3   Tea 5
3   Tea 3
3   Mint    2
3   Mint    2

2。平均。

代码&输出:

t <- aggregate(People ~ Day + Drink, data=t, mean)
Day Drink   People
1   Coffee  2
1   Tea 5
1   Mint    6
2   Coffee  2
2   Tea 6
2   Mint    6
3   Coffee  3
3   Tea 4
3   Mint    2

问题1:我如何计算标准错误(意思的标准偏差)?

3。累计值。

代码&amp;输出:

t <- transform(t, AccPeople = ave(People, Drink, FUN=cumsum))
Day Drink   People  Acc People
1   Coffee  2   2
1   Tea 5   5
1   Mint    6   6
2   Coffee  2   4
2   Tea 6   11
2   Mint    6   12
3   Coffee  3   7
3   Tea 4   15
3   Mint    2   14

问题2:我如何计算累积的标准偏差呢?

非常感谢!! (并抱歉数据格式错误!)

1 个答案:

答案 0 :(得分:2)

您可以使用ddply包中的plyr

library(plyr)
  1. 计算平均值和标准误差(和标准差):

    dat2 <- ddply(dat, .(Day, Drink), summarise, 
                  M = mean(People), SE = sd(People) / sqrt((length(People))), 
                  SD = sd(People))
    

    其中dat是数据框的名称。

  2. 计算累计平均值和累计标准差:

    ddply(dat2, .(Drink), mutate, 
          Macc = cumsum(M), SDacc = cumsum(SD))