我有一个数据集,包括每个国家的数据:牛奶中污染物x的患病率,污染物x的平均值和标准偏差以及牛奶的相对产量。 我可以计算总体加权平均值和平均值的相对单个加权值,但我不确定如何对标准偏差执行相同的操作。 下面是一个可重现的示例:
df<-data.frame(state=c("A","B","C","D"), prevalence=c(0.5,0.3,0.9,0.1),
mean=c(2,3,2.5,4.5), sd=c(1.38,0.93,1.04,1.58), ws=c(0.2,0.6,0.1,0.1))
sumpr<-sum(df$prevalence*df$ws)
df<-mutate(df, wm=ws*prevalence*mean/sumpr)
在df中,我现在有了“ ws”列,加权平均值总计为2.6,这是观测值的加权平均值。 有什么方法可以获取所有单个观测值的加权sd值? 任何帮助将是巨大的! 非常感谢!