标准backprop需要解决xor问题的训练集的最小暴露次数是多少?另一种类型的神经网络更快地解决了吗?
什么是最佳设置(隐藏层节点数,学习率)?
谢谢!
答案 0 :(得分:2)
如果您使用它们,它取决于网络布局,学习速率和正则化参数。
您可能也会对网络的初始权重感到幸运或不幸,因为在反向传播网络中,它们应该随机初始化。然而,意外开始接近当地最小值的可能性很小。
对于XOR函数,具有2个节点的单个隐藏层应该足够。
不应该需要偏置节点。也不需要正则化,因为过度拟合通常不是XOR函数的问题 关于学习率,在我的头脑中0.05是好的,但我没有确凿的证据。尝试一下,看看你是否能找到更好的价值。
在Coursera"机器学习"中非常直观地讨论了这个主题。课程。您可以查看Preview网站上的视频。寻找"神经网络:学习(第5周)"该页面上的部分。