如何在RL问题中设计密集奖励?有没有根本不可行的例子?

时间:2019-11-10 23:22:11

标签: deep-learning reinforcement-learning

给出一个RL问题,例如,机器人捡起一个物体。我们应该如何设计密集的奖励。

0 个答案:

没有答案