应用错误收集

数据的均值/方差的变化是否会影响svm分类器？

时间：2017-01-09 13:11:26

标签： python machine-learning scikit-learn svm

我在许多领域看到人们在传递给分类器或学习算法之前缩放他们的数据。我注意到通过做那个分类器会非常快。例如，在执行X=preprocessing.scale(X)之前使用py svm.SVC().fit(X,y)。这对分类器有影响吗？

编辑： X=preprocessing.scale(X)应该是

将数据集沿任意轴中心标准化为均值和分量明智的单位差异。

缩放到单位差异会产生任何影响吗？

1 个答案:

答案 0 :(得分：4)

您所指的概念称为“功能缩放”。假设您预测住房价格，并且您有2个功能：

房屋面积（x1）
房间数（x2）

房子的区域> 数千平方英尺，其中房间数会因而异> 1- 4 。在这种情况下， x1 功能将主导目标函数， x2 功能将在很大程度上被忽略。为避免这种情况，我们执行功能缩放。这确保了分类器关注每个特征。

<强>参考文献：

http://scikit-learn.org/stable/modules/preprocessing.html

https://en.wikipedia.org/wiki/Feature_scaling

相关问题

图像的方差和均值

在槌中使用带有朴素贝叶斯分类器的svmlight样式数据

方差的计算方法

使用SIFT功能训练SVM分类器

mrmr特征选择和SVM分类器m的意思是什么？

如何提高nodejs-multilabel SVM分类器的准确性？

提高SVM分类器精度的技术

数据的均值/方差的变化是否会影响svm分类器？

具有不同维度的数据的分类器

用于SVM分类器的Matlab fitcsvm函数的默认输出

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？