应用错误收集

如何在RL问题中设计密集奖励？有没有根本不可行的例子？

时间：2019-11-10 23:22:11

标签： deep-learning reinforcement-learning

给出一个RL问题，例如，机器人捡起一个物体。我们应该如何设计密集的奖励。

0 个答案:

没有答案