我正在使用libsvm
进行图片分类。为什么当我使用更多功能进行分类时,我的预测精度会降低它不应该增加?我的数据集大小固定为1600,用于培训,400用于测试。
答案 0 :(得分:5)
因为附加功能对于分离要素空间中的类可能毫无用处。准确性不一定与特征数量相关。
包含大量不良功能可能会导致SVM了解数据中的噪音,从而降低准确性。
例如,如果您的额外功能如下所示(为清晰起见使用2D绘图):
然后,将(在这种情况下)两个类分开将不是一个非常好的功能。例如,如果SVM仅针对此模式进行训练,则它不会很好地预测未来点的类别。但是,数据集中可能有一个如下所示的功能:
这样的功能在分离这两个类时非常有用。