标签: deep-learning artificial-intelligence reinforcement-learning
假设我尝试使用RL制作跳跃机器人。但RL需要反复试验,当然,我的机器人在开始时会跳过很多次失败。
开发人员如何教导可能在学习过程中破坏的机器人?
答案 0 :(得分:1)
如果机器人在强化学习过程中中断了怎么办?
然后你有一个破碎的机器人。
人们如何教导一个可以在学习RL时破坏的机器人?
我会这样做:
然后,当然,如果机器人跌落,就会在机器人身上添加电缆。我记得看过Boston Dynamics的机器人,但我现在找不到这些视频。