tic-tac-toe的神经网络

时间:2017-01-23 06:30:50

标签: machine-learning neural-network reinforcement-learning

我写的神经网络可以发挥井字游戏。网络有9个输入神经元,它描述了板的状态(1 - 用于网络移动,1.5 - 用于对手移动,0 - 用于空单元)和9个输出神经元(具有最高值的输出神经元表示给定的最佳动作)州)。网络没有隐藏层。激活功能 - sigmoid。学习方法 - Q学习+反向传播。

网络经过培训,但效果不佳(继续踩踏被占用的小区)。所以我决定添加一个隐藏层。我想问一下:

隐藏层中使用哪些神经元以及哪些激活函数更适合隐藏和输出层?

1 个答案:

答案 0 :(得分:1)

一般来说,隐藏层的神经元数量会被讨论here但是根据经验,隐藏层中神经元的数量应该与输入神经元的数量大致相同。

您还可以考虑添加讨论here

的隐藏图层数量

sigmoid激活功能很好,无论如何你可以检查它并与其他激活功能进行比较。

在您的特定情况下,您还可以考虑强制代理不要考虑(根本)通过使用输出神经元的不同架构来选择占用的单元格。