应用错误收集

我刚刚开始尝试使用神经网络，并希望创建一个能够通过q-learning学习玩游戏Gomoku的神经网络。在阅读了一些Lasagne教程和API之后，我不确定如何继续我的项目。另外，看看Lasagne附带的mnist示例，我不确定哪些代码（如果有的话）适用于我尝试做的事情。所以我想我的问题是，我需要创建和培训这样一个网络的Lasagne代码是什么？我不需要最有效的解决方案;对初学者来说简单易懂的事情将不胜感激。

其他一些细节：

我想有两个网络对战实例
我已经编写了一个基本程序，可以接受玩家移动（范围内的单个整数值（0，总棋盘位置 - 1））来模拟Gomoku游戏并返回胜利者，这对于为网络提供强化

感谢。

烤宽面条中的Q-Learning神经网络

0 个答案: