应用错误收集

时间：2018-03-18 03:38:13

标签： deep-learning artificial-intelligence reinforcement-learning

假设我尝试使用RL制作跳跃机器人。但RL需要反复试验，当然，我的机器人在开始时会跳过很多次失败。

开发人员如何教导可能在学习过程中破坏的机器人？

答案 0 :(得分：1)

如果机器人在强化学习过程中中断了怎么办？

然后你有一个破碎的机器人。

人们如何教导一个可以在学习RL时破坏的机器人？

我会这样做：

然后，当然，如果机器人跌落，就会在机器人身上添加电缆。我记得看过Boston Dynamics的机器人，但我现在找不到这些视频。