我试图对XOR神经网络进行编码长达数周之久,但我始终面临着同样的问题。首先,您必须知道我花了几个小时来尝试我在网上找到的所有内容,但没有任何效果。
尝试使用关于主题的 3Blue1Brown 视频完成此操作后,现在使用的http://neuralnetworksanddeeplearning.com/chap2.html。我编码了一个矩阵库 具有所有必要的功能。
我的网络确实具有3个层,其中包括:2个输入神经元,2个隐藏神经元,1个输出神经元。 此外,我有2个偏向指向隐藏的神经元,一个偏向输出神经元。我使用sigmoid函数,使其值在0到1之间,并使用二次成本函数。每次训练网络时(即每次使用反向传播),我都会选择一个随机输入及其相应的输出。
问题是,无论我训练多少次,输出都永远不会接近于0或1,而是总是混乱在0.5左右,而我的成本函数停留在0.14左右。
任何提示或帮助都被认可-我真的不明白问题出在哪里,我觉得我已经尽了一切。 PS:这里没有显示任何代码,如有需要,请不要犹豫。
答案 0 :(得分:0)
我设法通过在网络中添加图层来解决问题。而且,当我进行了改进以编写OCR时,我增加了学习率以逃避本地Miminas的困扰,这在一定程度上是我的网络每次停滞时都会出现的问题。