标签: robotics reinforcement-learning openai-gym
我试图了解如何将目标放入Hindsight Experience Replay Buffer(s,a,r,sg)中。因此,如果我有机器人,则状态将是图像,如果我尝试执行滑动任务,则目标将是2D坐标。应该有另一个目标,因为需要先将滑动任务击中球,然后将其推到所需位置。谁能解释一下?