是否需要单独为独立变量和因变量单独进行特征缩放

时间:2017-10-23 06:28:14

标签: machine-learning scikit-learn

假设我们的数据集非常少,所以我决定不将它分成火车和测试。由于我使用的模型是SVR,因此应该进行特征缩放。 我已经看到代码为X = sc_X.fit_transform(X)和Y = sc_X.fit_transform(Y)。相反,就像我们在训练集上进行fit_transform和在测试集上进行变换一样,可以在X和Y上进行相同的操作.Y是否需要fit_transform,因为sc_X已经学习了参数并将它们应用于Y

1 个答案:

答案 0 :(得分:0)

没有。首先,X可以有很多列,而简单任务的y只包含一列。因此,使用transform()会产生错误,因为Scaler已经学习了有关X列的信息。

其次,X和Y本身具有不同的尺度。因此,使用transform()将没有任何用处,并会在数据中引入更多差异。

最后,大多数情况下无需缩放y。它们将由大多数算法自动处理。