在进行特征选择后,我有18个维度的特征,将用于训练分类器,RNN,HMM等。
这些功能包含加速度计和陀螺仪的stddev,均值和导数。 这些功能具有不同的单元,规范化/标准化将失去功能的真正含义。
例如,一个特征向量的单位是旋转速度(度/秒),该特征中的值在-120和120之间。 另一个是x轴加速度的stddev,该值主要在0和2之间。 如果我想进行标准化,所有特征向量将以0为中心,负值/正值分布在零附近。 - >即使是stddev也会有负值!它完全失去了实际意义吗?
我走错了路吗?任何信息表示赞赏!谢谢!
答案 0 :(得分:-2)
总是强烈建议将特征缩放和规范化作为预处理步骤,它甚至会有利于梯度下降(最常见的学习算法),即使在你的情况下它会有用但如果你有疑问你可以执行交叉验证。例如,当使用图像和神经网络时,有时在归一化后,特征(像素)会得到负值,这不会使训练数据失去意义。