Python中的预处理 - 分类练习

时间:2018-02-20 05:04:38

标签: python python-3.x scikit-learn

是否有任何关于使用哪种预处理技术的规定?

目前,我正在尝试进行分类,其中数据集包括分类变量和数值变量。

我的问题是,是否有关于何时使用MinMaxScaler,StandardScaler和Normalizer的建议。

1 个答案:

答案 0 :(得分:0)

对此没有明确的答案。

我的建议是在没有预处理的情况下应用算法,并检查分类报告和混淆矩阵。然后使用预处理方法应用它并再次查看报告和矩阵。

预处理数据不一定会提高算法的准确性。

请查看以下论文的第15页,它表明实际上,某些算法可以处理其中的处理。

http://wen.ijs.si/ojs-2.4.3/index.php/informatica/article/download/148/140