如何使用种群大小,比例和误差的向量计算R中的加权平均值

时间:2016-11-13 18:46:05

标签: r standard-error

我试图从Gelman的Multilevel / Hierarchical模型书中复制一个问题。

他说:

  

给定N,p,se - 人口规模的向量,是的答案和标准误差的估计比例 - 我们可以计算加权平均值及其在R中的95%置信区间

他提供了这段代码:

w.avg <- sum(N*p)/sum(N)
se.w.av <- sqrt (sum ((N*se/sum(N))^2))
int.95 <- w.avg + c(-2,2)*se.w.avg

我不了解如何构建向量,N,Se和p。

他说N应该是一个矢量:N1,N2,N3 ......是一个国家(比如法国,德国,意大利)的成年人总数。 Ntot是欧盟的总数。加权平均值的标准误差为√ ((N1/Ntot)N1error)² + ((N2/Ntot)N2error)² + ((N3/Ntot)N3error)²

我正在努力构建向量N,se和p。

我知道如何构建一个简单的比例矢量:

y <- 700
n <- 1000
estimate <- y/n
se <- sqrt (estimate*(1-estimate)/n)

如何构建离散量子的矢量:

y <- rep (c(0,1,2,3,4), c(600,300,50,30,20))
n <- length(y)
estimate <- mean(y)
se <- sd(y)/sqrt(n)

我对如何构建多个离散比例的矢量感到困惑,每个比例都有自己的SE和置信区间?

1 个答案:

答案 0 :(得分:1)

使用数字向量,R将逐个元素计算,因此您计算一个示例的比例和标准误差的代码也适用于多个示例。例如

y <- c(700, 500)
n <- c(1000, 1000)
estimate <- y/n
se <- sqrt (estimate*(1-estimate)/n)

estimate的值为0.70.5,因为y/n使用相应的数字对700/1000500/1000进行计算。元素按位置对应 - y中的第一个元素与n中的第一个元素相同,依此类推。

se同样有两个元素,使用estimaten向量的相应元素。