应用错误收集

强化学习中的神经网络设置和监控

时间：2019-02-06 15:16:48

标签： neural-network artificial-intelligence reinforcement-learning

我有一些关于使用强化学习来训练神经网络的问题，例如DQN： 1.在定义模型时，我们应该使用正则化器还是辍学子？ 2.在学习阶段我们可以监控什么？

1 个答案:

答案 0 :(得分：1)

这个问题实际上并没有一个普遍的答案。这实际上取决于您的环境和方法，最好的方法是在有无测试的情况下比较结果。
您总是可以从监视网络丢失和每集的某些环境性能指标开始（如果您的环境是某些游戏，则可以监视每集的得分）