是否有必要在机器学习中规范化/标准化数据?

时间:2016-11-22 02:49:12

标签: machine-learning normalization

在进行特征选择后,我有18个维度的特征,将用于训练分类器,RNN,HMM等。

这些功能包含加速度计和陀螺仪的stddev,均值和导数。 这些功能具有不同的单元,规范化/标准化将失去功能的真正含义。

例如,一个特征向量的单位是旋转速度(度/秒),该特征中的值在-120和120之间。 另一个是x轴加速度的stddev,该值主要在0和2之间。 如果我想进行标准化,所有特征向量将以0为中心,负值/正值分布在零附近。 - >即使是stddev也会有负值!它完全失去了实际意义吗?

我走错了路吗?任何信息表示赞赏!谢谢!

1 个答案:

答案 0 :(得分:-2)

总是强烈建议将特征缩放和规范化作为预处理步骤,它甚至会有利于梯度下降(最常见的学习算法),即使在你的情况下它会有用但如果你有疑问你可以执行交叉验证。例如,当使用图像和神经网络时,有时在归一化后,特征(像素)会得到负值,这不会使训练数据失去意义。