需要标准化/标准化的scikit学习算法列表

时间:2018-09-09 06:38:36

标签: scikit-learn data-science

有人可以提供在使用前需要对数据进行标准化或标准化的所有算法的列表吗?或者有人可以在scikit-learn文档中找到在哪里可以找到它的示例。

1 个答案:

答案 0 :(得分:1)

在大多数情况下,功能缩放意味着:
1.使所有特征的平均值不要太大(例如0)
2.使所有功能的方差大致相同(例如1)

所以您的问题可以略有不同:
1)哪些算法取决于接近零的绝对值?
2)哪些算法要求值可比地分布?
3)哪些算法使用正则化功能来惩罚特征的极端权重?

第一点与ANN中的激活函数紧密相关,由于导数,该函数的最大学习能力接近于零(S型,tanh,relu)。

第二点和第三点与不同特征的权重相等有关。

通常,由于第二点和第三点,您应该始终进行缩放。决策树是一个例外,它不使用具有不同特征的任何联合指标,也不使用任何均值假设,因此无需缩放即可使用。