我正在阅读频繁的模式挖掘算法,并提出了以下问题。让一家公司拥有10,000种不同的产品,并且有1,000,000,000个交易,每个交易包含10种不同的产品。如果对于每个篮子统一选择产品,那么在1,000,000,000次交易中,1000个特定固定篮子被选择1000次的概率是多少?
这是自学,问题在here
的幻灯片9中说明答案 0 :(得分:0)
我不是概率论专家,但我认为机会几乎为0.要想明白为什么,想象一下你有一个包含所有可能的篮子的盒子。让B
成为框的基数,因此从框中抽取一个特定篮子的概率为p = 1/B
,大约为p = 10^(-40)
。想象一下,您从此框中抽取N
次替换。那么你会期望这个特定的篮子被绘制m = N/B times
。这是实验的预期频率。
此抽样过程的标准差(N
绘制成功概率p
)为σ = sqrt(N*p*(1-p))
。如果您使用N = 10^9
,p = 10^(-40)
进行数学计算,则会找到σ = sqrt(10^(-31))
。
现在假设实验的观察频率为f = 10^3
。由于预期频率为m = N/B = 10^9/10^40 = 10^(-31)
,因此本次实验的z-score
为
z = (f-m)/σ = sqrt(10)*10^17
观察特定篮子的至少f
个实例的机会由正常近似给出为z
和无穷大之间的标准正常曲线下的面积。这个区域几乎为零。