如果机器人在强化学习过程中中断,该怎么办?

时间:2018-03-18 03:38:13

标签: deep-learning artificial-intelligence reinforcement-learning

假设我尝试使用RL制作跳跃机器人。但RL需要反复试验,当然,我的机器人在开始时会跳过很多次失败。

开发人员如何教导可能在学习过程中破坏的机器人?

1 个答案:

答案 0 :(得分:1)

  

如果机器人在强化学习过程中中断了怎么办?

然后你有一个破碎的机器人。

  

人们如何教导一个可以在学习RL时破坏的机器人?

我会这样做:

  1. 进行模拟。那里有物理模拟,所以首先要确保你的RL代理在那里合理行事。
  2. 有约束:也许你不想让它直接跳。让我们先试着让它站稳脚跟。
  3. 放松约束。一旦完成一项任务,就可以选择更复杂的一个/一个,更有可能发生硬件损坏。
  4. 然后,当然,如果机器人跌落,就会在机器人身上添加电缆。我记得看过Boston Dynamics的机器人,但我现在找不到这些视频。