标签: reinforcement-learning openai-gym
我发现第一手需要设置env.seed(#)的所有强化学习算法,我想知道其背后的原因。
非常感谢您!
答案 0 :(得分:2)
我使用过的所有健身环境都使用过numpy's random number generator。您当然不需要自己播种,因为它会回退到当前时钟时间的播种。只要您担心可重复性,就可以手动指定种子。如果您不给RNG相同的种子,它将产生不同的随机数序列。由于机器学习受经验驱动,因此可重复性非常重要。