标签: machine-learning neural-network normalization
我目前正在训练具有tanh激活功能的神经网络(基本反向传播,没有重量衰减,动量或任何其他改进)来映射任意函数。训练数据在区间(-1,1)内。
我的培训方法如下:
我尝试使用
f(x)=(x-mean)/std_deviation
但验证数据的MSE未低于约1.49。没有标准化过程,它达到0.005。有人对此进行了解释或改进了我的培训程序和数据规范化吗?