我有一个我已创建的反向传播神经网络,并使用Kdb +数据库在Q中对其进行编码。
我正在将数据预处理到网络中,并将其归一化为[0,1]的形式,对网络进行训练并预测未来的大型数据集的移动平均值分别为60:20:20。
规范化公式:
processed data: (0.8*(VALn - MINn)/(MAXn - MINn))+0.1
VALn = unprocessed data value
MAXn = max of data set
MINn = min of data set
如何将新数据标准化为最终训练的网络?
我是否会通过以上公式运行新输入,保持训练集中的MIN和MAX值?
由于
答案 0 :(得分:0)
是的,对于预测,您应该使用与训练数据标准化相同的标准化公式。
答案 1 :(得分:0)
您应该保持相同的MAXn和MINn,因为在测试时更改它意味着您正在更改原始数据映射到处理数据的方式。要快速检查,请尝试使用不同的MAXn和MINn进行预处理,然后尝试预测训练案例。由于标准化数据看起来不像以前那样,因此性能会降低。
请注意,如果碰巧测试集中的数据高于/低于MAXn / MINn,那么这些数据在归一化后将不在[0,1]范围内。如果没有太多这些情况,这通常是可以的。它只是意味着神经网络看到的数据与先前看到的范围相差无几。