强化学习中的神经网络设置和监控

时间:2019-02-06 15:16:48

标签: neural-network artificial-intelligence reinforcement-learning

我有一些关于使用强化学习来训练神经网络的问题,例如DQN: 1.在定义模型时,我们应该使用正则化器还是辍学子? 2.在学习阶段我们可以监控什么?

1 个答案:

答案 0 :(得分:1)

  1. 这个问题实际上并没有一个普遍的答案。这实际上取决于您的环境和方法,最好的方法是在有无测试的情况下比较结果。
  2. 您总是可以从监视网络丢失和每集的某些环境性能指标开始(如果您的环境是某些游戏,则可以监视每集的得分)