我试图从Gelman的Multilevel / Hierarchical模型书中复制一个问题。
他说:
给定N,p,se - 人口规模的向量,是的答案和标准误差的估计比例 - 我们可以计算加权平均值及其在R中的95%置信区间
他提供了这段代码:
w.avg <- sum(N*p)/sum(N)
se.w.av <- sqrt (sum ((N*se/sum(N))^2))
int.95 <- w.avg + c(-2,2)*se.w.avg
我不了解如何构建向量,N,Se和p。
他说N应该是一个矢量:N1,N2,N3 ......是一个国家(比如法国,德国,意大利)的成年人总数。 Ntot是欧盟的总数。加权平均值的标准误差为√ ((N1/Ntot)N1error)² + ((N2/Ntot)N2error)² + ((N3/Ntot)N3error)²
我正在努力构建向量N,se和p。
我知道如何构建一个简单的比例矢量:
y <- 700
n <- 1000
estimate <- y/n
se <- sqrt (estimate*(1-estimate)/n)
如何构建离散量子的矢量:
y <- rep (c(0,1,2,3,4), c(600,300,50,30,20))
n <- length(y)
estimate <- mean(y)
se <- sd(y)/sqrt(n)
我对如何构建多个离散比例的矢量感到困惑,每个比例都有自己的SE和置信区间?
答案 0 :(得分:1)
使用数字向量,R将逐个元素计算,因此您计算一个示例的比例和标准误差的代码也适用于多个示例。例如
y <- c(700, 500)
n <- c(1000, 1000)
estimate <- y/n
se <- sqrt (estimate*(1-estimate)/n)
estimate
的值为0.7
和0.5
,因为y/n
使用相应的数字对700/1000
和500/1000
进行计算。元素按位置对应 - y
中的第一个元素与n
中的第一个元素相同,依此类推。
se
同样有两个元素,使用estimate
和n
向量的相应元素。