我在许多领域看到人们在传递给分类器或学习算法之前缩放他们的数据。我注意到通过做那个分类器会非常快。例如,在执行X=preprocessing.scale(X)
之前使用py svm.SVC().fit(X,y)
。这对分类器有影响吗?
编辑:
X=preprocessing.scale(X)
应该是
将数据集沿任意轴中心标准化为均值和分量 明智的单位差异。
缩放到单位差异会产生任何影响吗?
答案 0 :(得分:4)
您所指的概念称为“功能缩放”。 假设您预测住房价格,并且您有2个功能:
房子的区域>> 数千平方英尺,其中房间数会因而异> 1- 4 。 在这种情况下, x1 功能将主导目标函数, x2 功能将在很大程度上被忽略。为避免这种情况,我们执行功能缩放。这确保了分类器关注每个特征。
<强>参考文献:强>