如何在AlphaGo中使用卷积网络?

时间:2017-01-04 00:36:02

标签: deep-learning

如果我理解正确游戏,那么有一个19x19的棋盘。在AlphaGo Nature论文http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html中,它提到了卷积网络。我对卷积网络的理解是图像识别的例子。那么卷积网络如何应用于这个问题呢?将电路板转换为19x19图像不是一种过度杀伤吗?

1 个答案:

答案 0 :(得分:1)

Go受到模式的影响很大,正如您在图像分类中可能已经注意到的那样,卷积网络很擅长。

你问如果将一块板变成一张19 * 19的图像是不是太过分了,我不得不承认我没有尝试用0表示黑石头,0.5表示无石头,1表示一块白色的石头,用它训练一个网络,但我很确定它会在某种程度上起作用。

事情比这更极端! 19 * 19 go板转换为19 * 19 * 48输入张量。 (作为rgb图像,它只是19 * 19 * 3) 黑色宝石的一架飞机 白色石头的一架飞机 空旷的一架飞机 还有45个其他平面编码有助于网络知道的几个值。 (例如,自由,atari,移动后的自由,它们都在论文中,但你必须要了解更多关于去了解它们)

这是一种矫枉过正,绝对不是!卷积网络善于识别模式,但他们需要正确的信息才能这样做。例如,ladder对于该网络来说是不可能检测到的,因为不可能从板的一侧获取信息到另一侧并返回到所使用的13个卷积层内,因此使用了一些48个输入平面告诉网络某个移动是梯形捕获还是梯形逃生移动。