计算随机数在数据集中的两个数之间的概率

时间:2018-09-24 21:13:13

标签: r probability

我已经生成了一个随机的,正态分布的数据总体,平均值为341.08,标准差为3.07。这是代码:

pop <- rnorm(1000, mean=341.08,sd=3.07)

我需要找出随机抽取的数字落在337到343(包括两个数字)之间的可能性。我将如何执行呢?

1 个答案:

答案 0 :(得分:1)

这将使用您设置的边界将该向量制成表格:

table(cut(pop, c(-Inf,337,343,Inf) ))

(-Inf,337]  (337,343] (343, Inf] 
        87        645        268 

所以值的分数(也是概率)是:

table(cut(pop, c(-Inf,337,343,Inf) ))[2]/length(pop)
(337,343] 
    0.645 

要使其具有可重复性,您可以使用set.seed()

要完善估算值,如果将其作为一个理论性问题提出,则可以使用replicate模拟,或使用:

pnorm(343, 341.08, 3.07)-pnorm(337, 341.08, 3.07) 
[1] 0.6422225

第一种方法仅需要数据。其他两种方法将需要知道数据来自具有指定参数的正态分布。