如何在R中使用二项式随机变量求平均值?

时间:2018-07-23 17:20:42

标签: r

让我们说:

平均值(rbinom(100,42,0.76))并得到平均值 我们运行mean(rbinom(1000,42,0.76))并得到平均值。

现在,如果我们计算以下公式n * p,则在两个 情况将是42 * 0.76对吗?因为n将是42?在 两种情况?那么拥有100有什么影响,并且 1000个样本?

请帮助!!

1 个答案:

答案 0 :(得分:1)

这个问题最好属于Cross Validated

如果您选取二项式分布的样本,则该样本的平均值(通常)不会为42 * 0.76。相反,“平均”样本的平均值将为42 * 0.76。

样本数量之所以重要,是因为您处理的是人口中的一小部分。发挥到极致,看看它如何工作。

样本大小n =1。

  1. 如果绘制42,则样本平均值为42。
  2. 如果绘制32,则样本平均值为32
  3. 如果您绘制25,则样本平均值为25。
  4. 如果您抽取许多样本,则均值约为31.9(总体均值)。

更大的样本量不太可能由离群值控制,而更有可能接近总体平均值31.9。

您可以使用以下代码在r中将其可视化:

n_samp <- 1
hist(rbinom(n_samp,42,0.76),breaks = seq(0,42),xlim = c(0,42))
n_samp <- 1000
hist(rbinom(n_samp,42,0.76),breaks = seq(0,42),xlim = c(0,42))

binomial random with n = 1

binomial random with n = 1000