烤宽面条中的Q-Learning神经网络

时间:2017-07-17 19:17:02

标签: python neural-network lasagne q-learning

我刚刚开始尝试使用神经网络,并希望创建一个能够通过q-learning学习玩游戏Gomoku的神经网络。在阅读了一些Lasagne教程和API之后,我不确定如何继续我的项目。另外,看看Lasagne附带的mnist示例,我不确定哪些代码(如果有的话)适用于我尝试做的事情。所以我想我的问题是,我需要创建和培训这样一个网络的Lasagne代码是什么?我不需要最有效的解决方案;对初学者来说简单易懂的事情将不胜感激。

其他一些细节:

  • 我想有两个网络对战实例
  • 我已经编写了一个基本程序,可以接受玩家移动(范围内的单个整数值(0,总棋盘位置 - 1))来模拟Gomoku游戏并返回胜利者,这对于为网络提供强化

感谢。

0 个答案:

没有答案