我目前正在使用numpy.random.random_sample
来计算大量随机数。如果我删除这些数字中的每10个,结果是否仍然像以前一样随机?或者我会通过这样做引入某种倾斜吗?
答案 0 :(得分:8)
如果它们与真正的随机开始无法区分,那么它们将与之后的真随机无法区分。
原因是剩余数字之间存在的任何相关性或偏差也构成整个集合之间的相关性或偏差。因此,如果完整集是好的,则子集是好的。
当然,如果您根据价值选择性地删除数字,而不是仅基于它们在序列中的位置,则情况不一定如此。
另外,如果这些数字不开头,那么之后可能会比以前更糟糕。举一个极端的例子,考虑一个由9个零组成的序列,然后是硬币抛出的结果,9个零和另一个抛硬币等。这个数据源有一些熵(每10个值1位),但如果你删除每个第10个元素然后没有(剩下的输出事先知道)。