应用错误收集

因此，基本上，我试图建立一个AI代理来学习如何使用Tensor-force和pyautogui控制鼠标的移动。我希望这个代理人很好奇并且能够对环境中的不同事物做出响应。我应该建立一个单独的业务代表来控制给予第一业务代表的报酬，还是根据第一业务代表的行为为所述第二业务代表提供随机奖励，还是应该在张量力中获得对业务代表的好奇心？我注意到Tensor-force的库中提到了有关action_exploration的一些内容，但是我真的不明白它应该做什么...

我应该建立一个聪明的奖励代理商吗？

0 个答案: