Question

我知道在SVM中使用内核的想法是将数据点转换为无限维空间，其中点可以线性分离。这样我们就可以找到分隔点的最大边距。但是，如果我们能够分离所有点，为什么我们需要使用软边际？！据我所知，软边际背后的想法是，如果我们无法完全分离所有点，那么我们找到最佳可能的边际。因此，如果我们使用内核函数，那么软边距的整个概念对我来说毫无意义。那是什么意思？！

Answer 1

即使您可以创建完美匹配的分离超平面，它也可能过于复杂，因此容易Overfitting。 SVM的优点之一是软边距公式很自然地提供了在精度和泛化之间进行缩放的可能性。

Answer 2

您可能重复使用不同的标签。然后很明显你找不到一个分隔数据的平面。

Class A:  (3,3) (2,2) (1,1)
Class B:  (0,0) (1,1) (2,2)

软边际仍将在矛盾的数据集上产生合理的结果。实际上，数据表现不佳，并且内核技巧不能总是使其线性可分。有些数据很难分开。

如果我们在SVM中使用内核，为什么我们需要软边距？

2 个答案: