我目前已构建95%的置信区间,然后使用replicate()
随机生成1000个置信区间。我想测量多少间隔包含我的平均值。我知道理论上应该是950个,但是我如何得到一个确定的答案?下面列出了我使用的函数和均值。
z <- function(a,b,c){
error <- rnorm(a, b, c) * c / sqrt(a)
left <- b - error
right <- j + error
paste("[",round(left,2),";",round(right,2),"]")
}
set.seed(123)
replicate(1000, z(10,1,1))
我从这里去哪里?
答案 0 :(得分:0)
也许这就是您要尝试的事情?
此z()
将返回正态分布总体平均值的置信区间。
z <- function(N, mu, std, cl=95) {
alpha <- (1-cl/100)/2
# CI for population mean
sep <- std/sqrt(N)
z_s <- qnorm(1 - alpha)
pop_lower <- mu - z_s*sep
pop_upper <- mu + z_s*sep
c(lower=pop_lower, upper=pop_upper)
}
意味着如果我产生一个随机变量mean(rnorm(20, 0, 1))
,那么我们期望该变量的值位于z(20, 0, 1, 95)
内,概率为0.95。
要对此进行测试,我们可以
# specify parameters
N <- 20
mu <- 0
std <- 1
# produce a good number (10,000) of population means
set.seed(1)
r <- replicate(1e4, mean(rnorm(N, mu, std)))
# calculate confidence interval
ci <- z(N, mu, std)
# find which are below, within and above the interval
rc <- cut(r, c(min(r), ci, max(r)), c("below", "within", "above"))
# create a proportion table
round(prop.table(table(rc))*100, 2)
# below within above
# 2.59 95.08 2.33