具有回归的Theano / Lasagne基本神经网络不会过度拟合一号的数据集

时间:2016-07-23 14:17:35

标签: python neural-network theano lasagne

我正在使用Theano / Lasagne中的基本神经网络来尝试识别图像中的面部关键点,目前我正试图让它学习单个图像(我刚从训练集中拍摄了第一张图像) 。图像是96x96像素,有30个关键点(输出)需要学习,但它没有这样做。这是我第一次尝试使用Theano / Lasagne,所以我确定我错过了一些明显的东西,但我看不出我做错了什么:

group s by 1 // any constant
into gt

这给了我一个如下图:

enter image description here

我很漂亮这个网络应该可以将损失降到基本为零。我很感激有关此事的任何帮助或想法:)

编辑:删除了丢失和隐藏图层以简化问题。

1 个答案:

答案 0 :(得分:1)

事实证明,我忘记了改变输出节点功能:

lasagne.nonlinearities.softmax

为:

lasagne.nonlinearities.linear

我用作基础的代码是用于分类问题(例如计算出图片显示的数字),而我正在使用网络来解决回归问题(例如,试图找到图像中某些特征所在的位置) )。分类问题有几个有用的输出函数,其中softmax就是其中之一,但回归问题需要线性输出函数才能工作。

希望将来帮助其他人:)