好的,所以我通过一些试验和错误建立了一个神经网络。接下来进入反向传播。但为了做到这一点,我需要在输出上计算我的错误。
我为我的测试区域所做的情况如下。我有一辆汽车,在迷宫的一角,导航到迷宫的另一个角落。 输入是:
输出是:
所有输入和输出显然在-1和+1之间归一化。汽车只能前进,所以-1 = 0速度,+ 1 =最大速度。 (我知道速度有点无用,但是我想知道它是否能够确定最大速度是否会更快地达到它,或者它是否会自动减速角落,否则它将无法快速转动)
所以我所知道的是,我希望汽车从当前的位置,到迷宫的终点位置。我自己也不用担心别的事。
返回此脚本的错误计算部分。我阅读和遵循的所有指南都要求输出错误。如同,output - ideal = error
问题在于,为了让它进入迷宫的出口,我不知道转向或速度的理想方式是什么。
在我看来,这可能意味着两件事之一: 1.还有其他方法来处理我可以使用但不知道的错误。或者有一种方法可以在数学上以某种方式找出错误。 我期待从神经网络到很少输入/输出的方式。或者问它可能永远不会做的事情。因此,我无法计算出正确的错误。
任何可以帮助我弄清楚这个错误的人都将不胜感激!否则请解释我的错误或如何改进任务或I / O.
提前致谢!
答案 0 :(得分:3)
你混淆了两件事。您了解了神经网络的监督培训。当你试图解决没有受到监督的问题时,它更像是强化学习。在这种情况下,您无法访问"理想"回答。你只能或多或少地说当前的状态好/坏(比如实现迷宫的退出是一个好地方,而远远是坏的)。要么专注于监督学习问题,要么你使用的资源是好的,或坚持你的迷宫问题,并转向强化学习。