标签: matlab simulink reinforcement-learning
我正在尝试使用强化学习来训练代理作为电动机的控制器。
在阅读this example之后,我只做了一些小的修改:
但是,结果是:
它根本没有进行培训:( 奖励始终为零。
有人可以给我一些如何解决这个问题的建议吗?
非常感谢。
答案 0 :(得分:0)
您也许应该检查传递函数生成的输出值。
在水箱示例中,您具有“停止模拟”块,如果您的“高度”值超过20或小于0,该块将停止模拟。
这将说明您的每步步数为0,因为值不兼容而未采取任何步骤。