如果我系统地删除每个第n个,随机数是否仍然是随机的?

时间:2013-12-16 17:58:55

标签: python random numpy

我目前正在使用numpy.random.random_sample来计算大量随机数。如果我删除这些数字中的每10个,结果是否仍然像以前一样随机?或者我会通过这样做引入某种倾斜吗?

编辑:正如所指出的,归结为我的RNG有多好。我怎样才能知道我是否可以信任RNG,或者我如何发现潜在的倾斜?

1 个答案:

答案 0 :(得分:8)

如果它们与真正的随机开始无法区分,那么它们将与之后的真随机无法区分。

原因是剩余数字之间存在的任何相关性或偏差构成整个集合之间的相关性或偏差。因此,如果完整集是好的,则子集是好的。

当然,如果您根据价值选择性地删除数字,而不是仅基于它们在序列中的位置,则情况不一定如此。

另外,如果这些数字开头,那么之后可能会比以前更糟糕。举一个极端的例子,考虑一个由9个零组成的序列,然后是硬币抛出的结果,9个零和另一个抛硬币等。这个数据源有一些熵(每10个值1位),但如果你删除每个第10个元素然后没有(剩下的输出事先知道)。