Question

我目前已构建95％的置信区间，然后使用replicate()随机生成1000个置信区间。我想测量多少间隔包含我的平均值。我知道理论上应该是950个，但是我如何得到一个确定的答案？下面列出了我使用的函数和均值。

z <- function(a,b,c){
  error <- rnorm(a, b, c) * c / sqrt(a) 
  left <- b - error
  right <- j + error
  paste("[",round(left,2),";",round(right,2),"]") 
}

set.seed(123)
replicate(1000, z(10,1,1))

我从这里去哪里？

Answer 1

也许这就是您要尝试的事情？

此z()将返回正态分布总体平均值的置信区间。

z <- function(N, mu, std, cl=95) {
    alpha <- (1-cl/100)/2

    # CI for population mean
    sep <- std/sqrt(N)
    z_s <- qnorm(1 - alpha)
    pop_lower <- mu - z_s*sep
    pop_upper <- mu + z_s*sep

    c(lower=pop_lower, upper=pop_upper)
}

意味着如果我产生一个随机变量mean(rnorm(20, 0, 1))，那么我们期望该变量的值位于z(20, 0, 1, 95)内，概率为0.95。

要对此进行测试，我们可以

# specify parameters
N <- 20
mu <- 0
std <- 1

# produce a good number (10,000) of population means
set.seed(1)
r <- replicate(1e4, mean(rnorm(N, mu, std)))

# calculate confidence interval
ci <- z(N, mu, std)

# find which are below, within and above the interval
rc <- cut(r, c(min(r), ci, max(r)), c("below", "within", "above"))

# create a proportion table
round(prop.table(table(rc))*100, 2)

# below within  above 
#  2.59  95.08   2.33

在R中测试置信区间

1 个答案: