reinforcement-learning - 为什么不使用模拟环境作为已知模型进行基于模型的强化学习 - Thinbug

为什么不使用模拟环境作为已知模型进行基于模型的强化学习

时间：2020-06-04 04:30:27

标签： reinforcement-learning

我是DRL的新手，我看到很多案例使用模拟模型作为RL学习环境来进行无模型的RL，例如DQN家族和PG家族。所以问题是

1，我们已经有了一个已知的仿真模型，以及它是否会更好地直接使用模型来做基于模型的RL？
2，如果这样做，当我得到一个确定性模型？（其中P（next_state |（action，state））为始终为0或1）

0 个答案:

没有答案