我应该何时在机器学习中进行特征缩放或标准化?

时间:2018-08-11 17:23:07

标签: python machine-learning classification supervised-learning

我有一个包含92个功能的训练功能集。其中91个要素的布尔值是1或0。但是1个要素是数字的,范围是3-2000。

如果我对第92个特征进行特征缩放会更好吗?

如果是,最好的方法是什么?我正在使用Python。

1 个答案:

答案 0 :(得分:0)

有时,它很大程度上取决于您要用于预测的算法。假设如果您使用SVM并使用高斯内核,并且没有在输入上使用特征缩放,那么您可能会得出错误的假设,而大型特征将主导其他较小特征。通常,特征缩放始终是控制输入变化的最佳方法,并且使算法能够快速计算(换句话说,收敛到最优最小值)。