标签: julia montecarlo
我目前正在学习朱莉娅(Julia),在政策制定和非政策制定方面都陷入了蒙特卡洛方法。
问题:无论是否启用蒙特卡洛政策,我有什么区别?
我了解该问题的强化学习理论,但不太了解如何编写代码。
我想在冰湖环境中实现它。主要问题是我不允许使用GYM工具包,这在这里会有所帮助。