如何在R中使用pnorm计算N个随机变量的均值小于给定值的概率

时间:2019-04-06 04:41:48

标签: r statistics probability

在R中,可以说特定类型计算器的寿命遵循正态分布,均值= 5000小时,SD = 500小时。如果我不得不随机选择一个计算器,那么它持续不到4000小时的概率是多少?

我在R中的计算如下-

pnorm(4000, mean=5000, sd =500)

[1] 0.02275013

我的理解是否正确,因此概率为 0.02275013

接下来,假设从15个计算器中随机抽取了一个样本。平均寿命少于4000小时的概率是多少?我不确定如何在R中执行此操作?我所做的是

sample<-rnorm(15, mean = 5000, sd =500)
pop<-sd(sample/sqrt(15))
pnorm(4000, 4800, pop)

[1] 1.723545e-10

我的理解正确吗?

1 个答案:

答案 0 :(得分:2)

SO用于编码问题。这不是一个编码问题。但是我还是去这里。

我首先要指出,SO的指南指出:“寻求家庭作业帮助的问题必须包括您到目前为止为解决该问题所做的工作的摘要,以及解决的困难。”我不确定这个问题[编辑:最初提出的问题]是否符合此准则,但这是一个重要的统计信息主题,所以让我们讨论一下。

对于pnorm,对于具有给定均值和标准差(此处为5000和500)的正态分布,返回q(此处q = 4000)的累积概率是正确的。因此,是的,随机选择的计算器可持续少于4000小时的时间是0.02275-也就是说,大约2.3%的计算器可持续少于4000小时。

您的主要问题是关于15个随机选择的计算器的<平均值>平均值。该统计(均值)将具有概率分布。结果表明,N个随机变量的均值分别分布N(mu,sigma ^ 2),并且每个独立于其他变量,具有均等的正态分布,其期望值(mu)和sigma ^ 2 / N的方差。简而言之:

  • 如果X_i〜N(mu,sigma ^ 2)等于i = 1,...,N并且它们是独立的
  • 然后表示平均值〜N(mu,sigma ^ 2 / N)

所以在R中:

pnorm(4000, mean=5000, sd=500/sqrt(15))
# 4.742869e-15

这实际上是零。这是有道理的,因为随机采样持续时间少于4000小时(仅2.3%)的单个计算器的可能性很小。随机抽样15个平均时间少于4000小时的计算器会非常不幸,因此此类事件的可能性接近于零。