篮子频繁出现的预期概率是多少?

时间:2017-04-11 08:28:58

标签: probability

我正在阅读频繁的模式挖掘算法,并提出了以下问题。让一家公司拥有10,000种不同的产品,并且有1,000,000,000个交易,每个交易包含10种不同的产品。如果对于每个篮子统一选择产品,那么在1,000,000,000次交易中,1000个特定固定篮子被选择1000次的概率是多少?

这是自学,问题在here

的幻灯片9中说明

1 个答案:

答案 0 :(得分:0)

我不是概率论专家,但我认为机会几乎为0.要想明白为什么,想象一下你有一个包含所有可能的篮子的盒子。让B成为框的基数,因此从框中抽取一个特定篮子的概率为p = 1/B,大约为p = 10^(-40)。想象一下,您从此框中抽取N次替换。那么你会期望这个特定的篮子被绘制m = N/B times。这是实验的预期频率

此抽样过程的标准差(N绘制成功概率p)为σ = sqrt(N*p*(1-p))。如果您使用N = 10^9p = 10^(-40)进行数学计算,则会找到σ = sqrt(10^(-31))

现在假设实验的观察频率f = 10^3。由于预期频率为m = N/B = 10^9/10^40 = 10^(-31),因此本次实验的z-score

z = (f-m)/σ = sqrt(10)*10^17

观察特定篮子的至少f个实例的机会由正常近似给出为z和无穷大之间的标准正常曲线下的面积。这个区域几乎为零。