我对训练模型后功能缩放的工作方式有疑问。
让我们说神经网络模型通过外部温度训练来预测树木的高度。
训练数据中的最低室外温度为60F,最大值为100F。我将温度调整到0到1之间并训练模型。我保存模型以供将来预测。两个月后,我想预测一些新数据。但这次测试数据的最低和最高温度分别为-20F和50F。
受过训练的模型如何解决这个问题?我在训练集中强制缩放以生成训练模型的范围与测试数据范围不匹配。
什么会妨碍我对范围进行硬编码以扩展到我知道数据总是在-50F到130F之间?我在这里看到的问题是,如果我有一个具有许多功能的模型。如果我对每个特征施加不同的硬度,使用特征缩放基本上没有意义,是不是?
答案 0 :(得分:1)
不同的尺度不起作用。你的模型训练一个尺度,它学习一个尺度,如果你改变尺度,你的模型仍然会认为它的尺度相同,并做出非常偏移的预测。
再次训练将覆盖之前学到的内容。
所以,是的,硬编码你的缩放(优先直接对你的数据,而不是在模型内)。
为了获得高质量的结果,请使用您可以收集的所有数据进行训练。