当我没有设置SVM参数时,我将在测试集上获得99.9%的性能。然而,如果我设置参数'-c 10 -g 5',我将在测试集上获得大约33%的精度。
顺便说一下,我使用的SVM工具包是LibSVM。
我想知道数据集是否有问题。我无法弄清楚哪个结果更有说服力。
答案 0 :(得分:10)
您恰好遇到了C
和gamma
的默认值运行良好的问题(分别为1和1 / num_features)。
gamma=5
明显大于默认值。当默认值接近最优时,gamma=5
导致非常差的结果是完全合理的。大gamma
和大C
的组合是过度拟合的完美配方(例如,高训练集性能和低测试集性能)。