SVM如何工作?

时间:2016-06-01 23:10:13

标签: algorithm machine-learning svm

是否有可能提供SVM算法如何工作的高级但具体的解释? 高级别我的意思是它不需要深入研究所有不同类型的SVM,参数的具体细节,这些都不是。具体而言,我指的是解释代数的答案,而不仅仅是几何解释。 据我所知,它会找到一个决策边界,将数据点与训练集分成两个预先标记的类别。我也理解它会通过找到类别之间最大的差距并通过它绘制分离边界来实现这一目标。我想知道的是它如何做出这种决心。我不是在寻找代码,而是对所执行的计算和逻辑的解释。 我知道它与正交性有关,但具体步骤非常“模糊”。在任何地方我都能找到解释。

2 个答案:

答案 0 :(得分:1)

这里的video很好地涵盖了一个开创性的算法。对我来说,最大的启示是:(1)优化关键指标的平方,给我们一个总是正的值,这样最小化正方形(仍然容易微分)给了我们最优的; (2)使用一个简单但不太明显的内核技巧"使矢量分类易于计算。

仔细观察不需要的术语如何消失,留下N + 1个向量来定义N维中的间隙空间。

答案 1 :(得分:1)

我将为您提供一些非常小的细节,以帮助您继续了解SVM的工作原理。

使一切变得简单,2维和线性可分离的数据。 SVM的一般思想是找到一个最大化两个类之间的边际的超规划。您的每个数据都是来自中心的矢量。你建议一个超级计划,你将数据向量投影到定义超平面的向量中,然后你看看你的投影向量的长度是在超图之前还是之后,这就是你如何定义你的两个类。

这是一种非常简单的观看方式,然后您可以通过关注一些论文或视频来了解更多细节。