为什么不使用模拟环境作为已知模型进行基于模型的强化学习

时间:2020-06-04 04:30:27

标签: reinforcement-learning

我是DRL的新手,我看到很多案例使用模拟模型作为RL学习环境来进行无模型的RL,例如DQN家族和PG家族。所以问题是

  • 1,我们已经有了一个已知的仿真模型,以及它是否会 更好地直接使用模型来做基于模型的RL?
  • 2,如果这样做,当我得到一个 确定性模型? (其中P(next_state |(action,state))为 始终为0或1)

0 个答案:

没有答案