高偏差或差异? - SVM和我们的学习曲线

时间:2016-07-13 05:55:00

标签: machine-learning scikit-learn variance curves tradeoff

我从未见过这样的学习曲线。我是对的,发生了巨大的过度拟合吗?该模型更适合于训练数据,但对于测试数据则更为普遍。

通常情况下,如果有很高的差异,就像这里一样,更多的例子应该有所帮助。在这种情况下,他怀疑他们不会。这是为什么?为什么在文学/教程中很容易找到这种学习曲线的例子?

Learning curves. SVM, param1 is C, param2 is gamma

1 个答案:

答案 0 :(得分:1)

您必须记住SVM是非参数模型,因此更多样本不必减少方差。参数模型(如神经网络)可以或多或少地保证方差的减少,但SVM不是其中之一 - 更多的样本不仅意味着更好的训练数据,还意味着更复杂的模型。你的学习曲线是SVM过度拟合的典型例子,它在RBF内核中发生了很多。