标签: neural-network backpropagation q-learning
我使用Q-learning和神经网络作为评估者。经过几次训练迭代后,权重获取0到10范围内的值。权重是否可以采用这些值?或者这表明网络参数不好?
答案 0 :(得分:1)
权重可以取这些值。特别是当你传播大量的迭代时;需要“沉重”的联系,变得“沉重”。
plenty examples显示权重大于1的神经网络。Example。
此外,在此图片之后,没有重量限制:
legend