标签: reinforcement-learning pyautogui
因此,基本上,我试图建立一个AI代理来学习如何使用Tensor-force和pyautogui控制鼠标的移动。我希望这个代理人很好奇并且能够对环境中的不同事物做出响应。我应该建立一个单独的业务代表来控制给予第一业务代表的报酬,还是根据第一业务代表的行为为所述第二业务代表提供随机奖励,还是应该在张量力中获得对业务代表的好奇心?我注意到Tensor-force的库中提到了有关action_exploration的一些内容,但是我真的不明白它应该做什么...