为什么随着特征数量的增加,使用svm时分类精度会降低

时间:2013-01-25 12:10:37

标签: matlab classification svm

我正在使用libsvm进行图片分类。为什么当我使用更多功能进行分类时,我的预测精度会降低它不应该增加?我的数据集大小固定为1600,用于培训,400用于测试。

1 个答案:

答案 0 :(得分:5)

因为附加功能对于分离要素空间中的类可能毫无用处。准确性不一定与特征数量相关。

包含大量不良功能可能会导致SVM了解数据中的噪音,从而降低准确性。

例如,如果您的额外功能如下所示(为清晰起见使用2D绘图):

class1 = red, class2 = blue

然后,将(在这种情况下)两个类分开将不是一个非常好的功能。例如,如果SVM仅针对此模式进行训练,则它不会很好地预测未来点的类别。但是,数据集中可能有一个如下所示的功能: class1 = red, class2 = blue

这样的功能在分离这两个类时非常有用。