正如问题所述,我正在为pybrain中的强化学习寻找一个很好的解释/示例,因为关于此的文档让我感到困惑,我可以让它工作,但我不明白如何将它应用于其他事物。
由于 汤姆
答案 0 :(得分:9)
不幸的是,pybrain的rl类文档令人失望。我发现this blog非常有用。
总之,您需要确定以下组件(有关实现详细信息,请参阅链接上的教程):
env = Environment(...)
task = Task(env)
controller = Module(...)
learner = SARSA()
- >您也可以向学习者添加资源管理器。默认值为epsilon-greedy,epsilon = 0.3,decay = 0.9999。agent = Agent(controller, learner)
experiment = Experiment(task, agent)
每个大写的类都应该用PyBrain中的相应类替换。然后你只需运行一个do-while循环来执行迭代和学习。请注意,用户可以设置多个选项,在实际问题中,您最有可能需要编写子类来概括pybrain的基本类,但步骤与此处的步骤相同。