计算累积超几何分布

时间:2015-06-04 18:23:31

标签: r probability

假设我有100颗大理石,其中8颗是红色的。我画了30个大理石,我想知道至少有五个大理石是红色的概率是多少。我目前正在使用http://stattrek.com/online-calculator/hypergeometric.aspx,我分别在人口规模,成功数量,样本数量和样本成功数量方面输入了100,8,30和5。所以我感兴趣的概率是累积概率:$ P(X \ geq 5)$在这种情况下= 0.050。我的问题是,如何在R中计算出这个?

我试过

> 1-phyper(5, 8, 92, 30, lower.tail = TRUE)
[1] 0.008503108

但这与之前的答案截然不同。

2 个答案:

答案 0 :(得分:3)

phyper(5, 8, 92, 30)给出了五个或更少红色大理石的概率。

1 - phyper(5, 8, 92, 30)因此返回获得六个或更多红色大理石的概率

由于您希望获得五个或更多(即超过4个)红色弹珠的概率,您应该使用以下其中一个:

1 - phyper(4, 8, 92, 30)
[1] 0.05042297

phyper(4, 8, 92, 30, lower.tail=FALSE)
[1] 0.05042297

答案 1 :(得分:0)

为什么要使用:

1 - phyper(..., lower.tail = TRUE)

易于使用:

phyper(..., lower.tail = FALSE)

。即使它们在数学上是等价的,也有数值原因优先选择后者。

这可以解决您的问题吗?我相信你正在将正确的输入放入phyper函数中。您是否可能在链接的网站中查看错误的输出?