如何实施强化学习模型?

时间:2020-10-29 18:38:56

标签: python reinforcement-learning

我对强化学习有一些疑问。我已经研究了强化学习的所有数学背景,但是无法对此模型进行编码。

我对定义环境感到困惑。我们可以使用OpenAI体育馆解决各种问题吗?这对我来说没有意义。例如,玩游戏不同于预测股票。但是在这两种情况下,我怎么看到有人使用OpenAI健身房?

我也找到了以下列表。究竟是什么论文?他们是实施强化学习模型的框架吗?

enter image description here

您能否提供一个链接,源,视频,课程或任何可以让我明白的东西。

1 个答案:

答案 0 :(得分:2)

OpenAI Gym是环境的集合。如果您研究了RL的数学背景,那么Gym就是MDP的集合。然后由您将RL算法与这些MDP挂钩,并进行实际学习。

您发现的列表可能有点旧,因为rllab最近已重命名为garage。我不了解它们中的大多数,但我会说它们是已经实现的RL算法库(至少这是rllab和OpenAI基准)。您可以查看他们的代码,以了解他们如何实现不同的RL算法。