我开始学习神经网络,我遇到了数据规范化。我理解它的必要性,但是一旦我的模型被训练并且在现场,我不知道如何处理我的数据。
假设我接受输入数据,减去其均值并除以标准差。然后我把它作为输入,我训练我的神经网络。
一旦进入现场,我该如何处理我想要预测的输入样本?
我是否需要保持训练数据的均值和标准偏差并使用它来规范化?
答案 0 :(得分:1)
正确。用于标准化训练数据的均值和标准偏差与用于标准化测试数据的平均值和标准偏差相同(即,不计算测试数据的均值和标准差)。
希望此链接能为您提供更多有用的信息:http://cs231n.github.io/neural-networks-2/
关于预处理的重要一点是,任何预处理统计数据(例如数据均值)必须仅在训练数据上计算,然后应用于验证/测试数据。例如。计算平均值并从整个数据集中的每个图像中减去它,然后将数据拆分为train / val / test splits将是一个错误。相反,必须仅在训练数据上计算均值,然后从所有分组(训练/值/测试)中平均减去均值。