我目前正在尝试创建自己的神经网络。我已经设法使网络工作到一定程度,但据我所知,当我运行程序时,我似乎陷入局部最小值,或者网络吐出的至少输出似乎在非常缓慢地变化步伐。节奏改变/或者我得到更好的输出,因为我在隐藏层中添加更多节点,任何人都可以建议或查看我的代码,看看它为什么不使用隐藏层中的2个节点。为什么我必须在隐藏层中添加更多节点才能获得合适的mse。
提前谢谢。
这是在100000次迭代结束时使用2个节点的mse:
0.07402
0.07402
0.07402
等等。正如你所看到的那样,mse应该在0.001左右,但是它非常高。