当提及时使用min-max-scaler和Standard Scalar时。 我认为这取决于数据。是否有任何数据特征可供查看以决定采用哪种预处理方法。 我查看了docs,但有人可以让我更深入地了解它。
答案 0 :(得分:0)
我希望这会有所帮助。
何时使用MinMaxScaler,RobustScaler,StandardScaler和Normalizer
https://towardsdatascience.com/scale-standardize-or-normalize-with-scikit-learn-6ccc7d176a02
答案 1 :(得分:0)
缩放比例的确取决于您将要使用的数据类型。在大多数情况下,StandardScaler
是首选的缩放器。如果您知道有一些异常值,请选择RobustScaler
。
然后,您处理一些具有怪异分布的功能,例如数字,使用这些缩放器并不是最佳选择。确实,在此数据集上,有很多像素为零,这意味着您需要对此分布进行除以std的零拾取。开发。不会有好处。因此,基本上,当一个特征的分布远非正态分布时,您就需要采取另一种选择。
对于数字,MinMaxScaler
是更好的选择。但是,如果您希望将零保持为零(因为使用稀疏矩阵),则将使用MaxAbsScaler
。
注意:如果您希望某个功能遵循原始分布的正态分布/均匀分布,请同时查看QuantileTransformer
和PowerTransformer
。