为什么神经网络停止学习?

时间:2019-04-21 18:10:19

标签: python machine-learning deep-learning q-learning

我正在写一个已经学会玩“ connect4”游戏的神经网络。 Repository 我正在使用CNN和Q-Learning。另一个困难是,Agent每次移动后都无法更改Q功能。必须记住移动,只有在玩过游戏后才能更改Q功能。 但是奇怪的是,因为在1-3个时代之后,所有动作都变得一样。 这是通过validate()函数证明的。

日志:

Epoch 0/10000
Right ANS=410, Real=[8, 8, 8]
Epoch 0/10000
Right ANS=410, Real=[8, 8, 8]
Epoch 100/10000
Right ANS=410, Real=[8, 8, 8]
...
Epoch 9900/10000
Right ANS=410, Real=[8, 8, 8]

结构:

Conv2D(input_layer, filters=32)
Flatten()
Dense(60)
Dense(30)
Dense(10) -- output, reward for every action 

即使我尝试更改神经网络的结构,也什么也没发生。

为什么会这样?

0 个答案:

没有答案