应用错误收集

时间：2013-01-25 12:10:37

标签： matlab classification svm

我正在使用libsvm进行图片分类。为什么当我使用更多功能进行分类时，我的预测精度会降低它不应该增加？我的数据集大小固定为1600，用于培训，400用于测试。

答案 0 :(得分：5)

因为附加功能对于分离要素空间中的类可能毫无用处。准确性不一定与特征数量相关。

包含大量不良功能可能会导致SVM了解数据中的噪音，从而降低准确性。

例如，如果您的额外功能如下所示（为清晰起见使用2D绘图）：

class1 = red, class2 = blue

然后，将（在这种情况下）两个类分开将不是一个非常好的功能。例如，如果SVM仅针对此模式进行训练，则它不会很好地预测未来点的类别。但是，数据集中可能有一个如下所示的功能： class1 = red, class2 = blue

这样的功能在分离这两个类时非常有用。