何时使用min-max-scalar和标准标量

时间:2018-03-21 13:59:53

标签: python-3.x scikit-learn

当提及时使用min-max-scalerStandard Scalar时。 我认为这取决于数据。是否有任何数据特征可供查看以决定采用哪种预处理方法。 我查看了docs,但有人可以让我更深入地了解它。

2 个答案:

答案 0 :(得分:0)

我希望这会有所帮助。
何时使用MinMaxScaler,RobustScaler,StandardScaler和Normalizer
https://towardsdatascience.com/scale-standardize-or-normalize-with-scikit-learn-6ccc7d176a02

答案 1 :(得分:0)

缩放比例的确取决于您将要使用的数据类型。在大多数情况下,StandardScaler是首选的缩放器。如果您知道有一些异常值,请选择RobustScaler

然后,您处理一些具有怪异分布的功能,例如数字,使用这些缩放器并不是最佳选择。确实,在此数据集上,有很多像素为零,这意味着您需要对此分布进行除以std的零拾取。开发。不会有好处。因此,基本上,当一个特征的分布远非正态分布时,您就需要采取另一种选择。

对于数字,MinMaxScaler是更好的选择。但是,如果您希望将零保持为零(因为使用稀疏矩阵),则将使用MaxAbsScaler

注意:如果您希望某个功能遵循原始分布的正态分布/均匀分布,请同时查看QuantileTransformerPowerTransformer