我与一位同事进行了史诗般的辩论,他声称减少隐藏数量是处理过度培训的最佳方式。
虽然可以证明泛化误差随着这种网络的训练而降低,但最终它不会达到更多隐藏和早期停止可以达到的水平。
我认为我们的项目有许多类型的“条件反射”,其中非平稳性只是其中之一。我认为需要大量的隐藏处理这些可以比作输入类别的问题。
虽然这对我来说似乎很直观,但我无法做出令人信服的论证。
答案 0 :(得分:0)
最基本的论据之一是,该方法应具有强大的理论依据和有用的含义。特别是,虽然可以使用隐藏单元的数量来减少过度拟合,但其主要缺点是: