Pybrain强化学习实例

时间:2015-06-13 13:19:46

标签: neural-network pybrain

正如问题所述,我正在为pybrain中的强化学习寻找一个很好的解释/示例,因为关于此的文档让我感到困惑,我可以让它工作,但我不明白如何将它应用于其他事物。

由于 汤姆

1 个答案:

答案 0 :(得分:9)

不幸的是,pybrain的rl类文档令人失望。我发现this blog非常有用。

总之,您需要确定以下组件(有关实现详细信息,请参阅链接上的教程):

  1. 环境:env = Environment(...)
  2. 任务 - > task = Task(env)
  3. 一个控制器,它是一个模块(如表格),用于保存您的行动价值信息 - > controller = Module(...)
  4. 学习者 - > learner = SARSA() - >您也可以向学习者添加资源管理器。默认值为epsilon-greedy,epsilon = 0.3,decay = 0.9999。
  5. 集成控制器和学习器的代理 - > agent = Agent(controller, learner)
  6. 整合任务和代理并进行实际迭代的实验 - > experiment = Experiment(task, agent)
  7. 每个大写的类都应该用PyBrain中的相应类替换。然后你只需运行一个do-while循环来执行迭代和学习。请注意,用户可以设置多个选项,在实际问题中,您最有可能需要编写子类来概括pybrain的基本类,但步骤与此处的步骤相同。