Ruby兰特的有效种子范围是多少?

时间:2013-11-19 16:07:35

标签: ruby random mersenne-twister random-seed

Ruby将PRNG实现为“经过修改的Mersenne Twister,周期为2 ** 19937-1。” 1

我理解MT的方式是它在2 ^ 32个不同的种子上运行。令我困惑的是,Random.new(seed)接受任意大数字,例如Random.new(2**100)

但是,我无法找到(逻辑)碰撞:

Random.new(1).rand(10**5) == Random.new(2**32-1).rand(10**5) => false
Random.new(1).rand(10**5) == Random.new(2**32).rand(10**5) => false
Random.new(1).rand(10**5) == Random.new(2**32+1).rand(10**5) => false

鉴于我们希望利用MT的最大种子范围,我们希望尽可能多地使用不同的种子,同时仍然避免与两种不同的种子发生碰撞,那么种子范围是如何实现的呢?

我尝试了解Ruby随机实现中发生的事情,但没有走得太远。 https://github.com/ruby/ruby/blob/c5e08b764eb342538884b383f0e6428b6faf214b/random.c#L370

1 个答案:

答案 0 :(得分:11)

Mersenne Twister序列长2 ** ( 624 * 32 - 1 ) - 1,种子值用于设置PRNG的内部状态,该状态与该序列中的位置直接相关。

最容易找到的重复似乎是每个2 ** ( 624 * 32 ),并且可以显示为这样:

 repeat_every =  2 ** ( 624 * 32 )

 start_value = 5024214421  # Try any value

 r1 = Random.new( start_value )

 r2 = Random.new( start_value + repeat_every )

 r17 = Random.new( start_value + 17 * repeat_every )

 r23 = Random.new( start_value + 23 * repeat_every )

 r1.rand == r2.rand  
 # true

 r17.rand == r23.rand  
 # true

或试试这个:

 repeat_every =  2 ** ( 624 * 32 )

 start_value = 5024214421  # Try any value

 r1 = Random.new( start_value )

 r2 = Random.new( start_value + repeat_every )

 Array.new(10) { r1.rand(100) }
 # => [84, 86, 8, 58, 5, 21, 79, 10, 17, 50]

 Array.new(10) { r2.rand(100) }
 # => [84, 86, 8, 58, 5, 21, 79, 10, 17, 50]

重复值与Mersenne Twister的工作方式有关。 MT的内部状态是一个由624个32位无符号整数组成的数组。您链接的Ruby源代码将Ruby Fixnum打包成一个数组 - 魔术命令是

  rb_integer_pack( seed, buf, len, sizeof(uint32_t), 0,
        INTEGER_PACK_LSWORD_FIRST|INTEGER_PACK_NATIVE_BYTE_ORDER );

然而,这不是一件容易玩的东西,它在internal.h中定义,所以只有在你自己使用Ruby解释器时才能真正访问它。您无法在正常的C扩展名中访问此功能。

然后,函数init_by_array将打包的整数加载到MT的内部状态。这是一个非常复杂的函数 - 打包的种子值不是字面写入状态,而是逐项生成状态,添加提供的数组值,使用各种xors,adds和交叉引用之前的值(此处的Ruby源也添加了打包数组的索引位置,注释为“非线性”,我认为这是对标准MT的引用修改之一)

请注意,MT序列的大小小于而不是2 ** ( 624 * 32 ) - 我在此处显示的repeat_every值一次跳过2个序列,但它是最容易找到重复的种子值,因为很容易看出它如何设置内部状态完全相同(因为种子的数组表示中的前624项是相同的,这就是以后使用的所有项)。其他种子值也会产生相同的内部状态,但该关系是一个复杂的映射,它将19938位空间中的每个整数与另一个整数配对,从而为MT创建相同的状态。