我正在尝试使用ddply apply函数来计算平均值,标准误差和标准偏差,但是没有输出。此数据集中没有“ NA”,因此丢失数据不应该成为问题。栖息地和物种都是因素。
这是我的数据集的一小部分样本
KubernetesPodOperator(
....
xcom_push=False
)
这是执行计算的代码的副本,但是平均值的输出显示为原始数据集中的“ Count”值,而sd和se的所有值均为“ NA”
Habitat Species Count
A T 3
A T 4
A U 5
B V 12
C V 3
D X 2
我还使用了summaryBy()函数和聚合函数。 如果有人可以向我建议使用ddply函数的要求以及可能导致此错误的原因,将不胜感激。
答案 0 :(得分:0)
此代码可以正常工作:
require(plyr)
require(tidyverse)
dataset <- data.frame(Habitat = c("A","A","A","B","C","D"),
Species = c("T","T","U","V","V","X"),
Count = c(3,4,5,12,3,2))
cdata <- ddply(dataset, c("Species", "Habitat"), summarise, N =sum(Count),mean =mean(Count),sd =sd(Count) )
cdata$se <- cdata$sd / cdata$N
对于se
计算,为复杂起见,我添加了另一步。