使用ddply函数计算平均值,标准误差和标准偏差的误差

时间:2020-01-30 12:16:35

标签: r

我正在尝试使用ddply apply函数来计算平均值,标准误差和标准偏差,但是没有输出。此数据集中没有“ NA”,因此丢失数据不应该成为问题。栖息地和物种都是因素。

这是我的数据集的一小部分样本

KubernetesPodOperator(
         ....
         xcom_push=False
)

这是执行计算的代码的副本,但是平均值的输出显示为原始数据集中的“ Count”值,而sd和se的所有值均为“ NA”

Habitat   Species      Count
   A         T           3
   A         T           4
   A         U           5
   B         V           12
   C         V           3
   D         X           2

我还使用了summaryBy()函数和聚合函数。 如果有人可以向我建议使用ddply函数的要求以及可能导致此错误的原因,将不胜感激。

1 个答案:

答案 0 :(得分:0)

此代码可以正常工作:

require(plyr)
require(tidyverse)

dataset <- data.frame(Habitat = c("A","A","A","B","C","D"),
            Species = c("T","T","U","V","V","X"),
            Count = c(3,4,5,12,3,2))

cdata <- ddply(dataset, c("Species", "Habitat"), summarise, N    =sum(Count),mean =mean(Count),sd   =sd(Count)  )

cdata$se <- cdata$sd / cdata$N

对于se计算,为复杂起见,我添加了另一步。