如果不知道游戏的目标输出,我怎么能找到神经网络的成本呢?

时间:2018-03-13 05:09:46

标签: neural-network

例如,

我想创建一个播放Ticktacktoe的AI,这就是我要去做的事情。 我有9个输入节点,用于电路板上的每个空间,3个节点用于一个隐藏层(我猜测它会通过选择具有3个空格的行或列来以某种方式使AI受益),然后9个输出节点到看看AI会在整个电路板上留下什么印记。

我迷失在如何找到这个神经网络的成本,因为我不知道如何判断它的预测并影响它的权重和偏差。 如果我想让AI玩一个猜谜游戏,那就有意义了,因为我有正确的答案,我可以根据实际答案的不确定程度来教它更准确。

(注意:我对神经网络很陌生,所以可能有一个我错过的简单答案)

1 个答案:

答案 0 :(得分:0)

所以,我做了一些挖掘,并找到了强化学习的一个很好的介绍。这是用于训练神经网络以实现目标的方法,而不知道在某种情况下移动是好的精确目标。反向传播不是唯一的学习方法,但是很多来源只使用这种方法而不让观众知道任何让我困惑的方法。

立即浏览此播放列表:https://www.youtube.com/watch?v=2pWv7GOvuf0&index=1&list=PL7-jPKtc4r78-wCZcQn5IqyuWhBZ8fOxT

希望这有助于有人开始使用神经网络!