使用均值来计算最可能的情况

时间:2018-10-16 11:11:21

标签: r probability

在汽车租赁服务中,有50%的汽车会按时归还。研究了20个租车者的样本。为了计算所有20辆汽车按时归还的概率,我使用二项分布:

dbinom(x=20, size=20, prob=0.5)

我该如何计算均值以确定最有可能退回的汽车数量? 要计算平均值,我使用:

mean(dbinom(x=20, size=20, prob=0.5))

返回:

[1] 9.536743e-07

然后如何使用均值来计算最有可能退回的汽车数量?

2 个答案:

答案 0 :(得分:2)

most likely number of returned carsmean number of returned cars通常不同。

特别是,前者被约束为整数;后者可能是连续值。

前者的答案来自dbinom

xx = 0:20
xx[which.max(dbinom(xx, size=20, prob=0.5))]
# [1] 10

如果您想要平均值,则只需加权xx

sum(xx*dbinom(xx, size = 20, prob = .5))
# [1] 10

当然,二项式变量的平均值为prob * size,因此您只需要选择一个prob的值即可,这不是整数即可看到差异:

prob = sqrt(2)/2
xx[which.max(dbinom(xx, size=20, prob=prob))]
# [1] 14
sum(xx*dbinom(xx, size = 20, prob = prob))
# [1] 14.14214

如果您确实坚持使用mean,则可能意味着要模拟二项式分布的平均值,在这种情况下,您需要使用rbinom代替:

mean(rbinom(1e6, size = 20, prob = .5))
# [1] 10.00235

答案 1 :(得分:1)

预期值为E(X)= np,这是最可能的结果。

模式为:

  1. (n + 1)p的底数,如果(n + 1)p为0或非整数,则
  2. (n + 1)p和(n + 1)p-1,如果(n + 1)p在{1,...,n}中
  3. n,如果(n + 1)p = n + 1