我正在训练一个用于音频分类的神经网络。
我在关于神经网络的任何书籍/课程中都建议实现输入的规范化。我将它们归一化为0均值和单位方差。 问题是我在训练和测试集中都没有获得更好的准确性。相反,两种准确度都大幅下降(4-8%)
我按如下方式实施:
mean = np.mean(X_train, axis = 0)
std = np.std(X_train, axis = 0)
X_train = (X_train-mean)/std
X_test = (X_test-mean)/std # apply the same transformation to the test set
X_val = (X_val-mean)/std # apply the same transformation to the validation set
其中X_train是维度矩阵(4000,60,130,1),其中(批量,高度,宽度,#channel)
我是否对代码做错了,或者我的问题可能在其他地方? 输入的归一化是否总是用于提高优化算法的准确度和/或收敛时间?