标签: python reinforcement-learning openai-gym
我正计划培训Mario特工使用DQN自己玩游戏。但是我也希望能够控制代理,例如它被卡在管道上,然后让它自己继续播放。我该如何提取需要帮助的特定状态?