水库采样:为什么随机选择均匀

时间:2015-03-18 19:59:23

标签: algorithm

我理解算法是如何工作的。但是,我不明白为什么它是正确的。假设我们只需要选择一个元素。这是我发现

的证据
  

在每一步N,保持流中的下一个元素的概率为1 / N.这意味着我们有一个(N-1)/ N概率保持我们当前持有的元素,这意味着我们保持它的概率(1 /(N-1))*(N-1)/ N = 1 / N.

除了最后一部分,我理解一切。为什么我们将概率相乘?

1 个答案:

答案 0 :(得分:2)

因为Pr[A AND B] == Pr[A] * Pr[B],假设AB是独立的(因为它们在这里)。选择元素而不是在以后更换元素的可能性是这两种可能性的产物。概率。