应用支持向量机时是否有必要对二进制预测变量进行标准化/标准化?

时间:2019-03-08 10:25:42

标签: svm normalization binary-data dummy-variable standardized

我是机器学习的新手。我了解到,在应用支持向量机(SVM)方法之前,需要对连续变量/预测变量进行标准化/标准化。我们如何处理具有C类的分类预测变量?将它们分解为C个伪/二进制预测变量?而我们如何处理二进制呢?保留它们不变还是使其标准化?

对我而言,计算二进制预测变量的均值和标准差然后将0和1(二进制变量的值)基本上重新编码为(0-mean)/std.dev对我来说是没有意义的。和(1-均值)/std.dev。分别。此外,我知道使连续预测变量标准化的原因是,使它们被测量的规模/度量单位不会影响SVM解决方案。考虑到这一点,编码为0-1的二进制/虚拟预测变量不应影响SVM解决方案。

0 个答案:

没有答案