Question

我试图从Gelman的Multilevel / Hierarchical模型书中复制一个问题。

他说：

给定N，p，se - 人口规模的向量，是的答案和标准误差的估计比例 - 我们可以计算加权平均值及其在R中的95％置信区间

他提供了这段代码：

w.avg <- sum(N*p)/sum(N)
se.w.av <- sqrt (sum ((N*se/sum(N))^2))
int.95 <- w.avg + c(-2,2)*se.w.avg

我不了解如何构建向量，N，Se和p。

他说N应该是一个矢量：N1，N2，N3 ......是一个国家（比如法国，德国，意大利）的成年人总数。 Ntot是欧盟的总数。加权平均值的标准误差为√ ((N1/Ntot)N1error)² + ((N2/Ntot)N2error)² + ((N3/Ntot)N3error)²

我正在努力构建向量N，se和p。

我知道如何构建一个简单的比例矢量：

y <- 700
n <- 1000
estimate <- y/n
se <- sqrt (estimate*(1-estimate)/n)

如何构建离散量子的矢量：

y <- rep (c(0,1,2,3,4), c(600,300,50,30,20))
n <- length(y)
estimate <- mean(y)
se <- sd(y)/sqrt(n)

我对如何构建多个离散比例的矢量感到困惑，每个比例都有自己的SE和置信区间？

Answer 1

使用数字向量，R将逐个元素计算，因此您计算一个示例的比例和标准误差的代码也适用于多个示例。例如

y <- c(700, 500)
n <- c(1000, 1000)
estimate <- y/n
se <- sqrt (estimate*(1-estimate)/n)

estimate的值为0.7和0.5，因为y/n使用相应的数字对700/1000和500/1000进行计算。元素按位置对应 - y中的第一个元素与n中的第一个元素相同，依此类推。

se同样有两个元素，使用estimate和n向量的相应元素。