使用线性内核的svm最好用在哪里?

时间:2013-12-13 12:43:54

标签: machine-learning svm

我目前正在研究svm,并且想知道svm对线性内核的应用是什么。在我看来,它必须适用于解决线性优化问题。这是对的吗?

感谢您的回答!

5 个答案:

答案 0 :(得分:24)

还要补充一点:线性SVM比非线性更不容易过度拟合。您需要根据您的情况决定选择哪个内核:如果您的功能数量与训练样本相比非常大,那么只需使用线性内核;如果您的功能数量很少,但是训练样本很大,您可能还需要线性内核但尝试添加更多功能;如果你的特征数很小(10 ^ 0 - 10 ^ 3),且样本数是中间的(10 ^ 1 - 10 ^ 4),使用高斯核会更好。

据我所知,具有线性内核的SVM通常与逻辑回归相当。

答案 1 :(得分:4)

线性内核有一些优点,但可能(在我看来)最重要的一个事实是,与非线性内核(如RBF)相比,训练通常更快。

如果您的数据集大小以千兆字节为单位,您会发现培训时间差异很大(分钟与小时数)。

答案 2 :(得分:4)

线性内核最适用于线性可分的数据。想象一下,您的数据集只有2个功能和2个类。如果使用X和Y两个要素在图表中绘制数据集样本,您将能够看到来自不同类的样本相对于彼此的位置。

如果很容易画一条分隔两个类的行,那么线性内核对于这项工作来说非常棒:

enter image description here

当然,这适用于许多功能,而不仅仅是两个,渲染多维空间。但是,如果您的数据不是线性可分的,则需要使用RBF或多项式等内核将样本映射到另一个维度空间。

此外,由于线性内核不执行任何映射,因此训练分类器通常比使用其他内核更快。

答案 3 :(得分:3)

具有线性内核的支持向量机的应用是执行分类或回归。当存在线性决策边界或线性拟合数据时,它将表现最佳,因此是线性内核。

答案 4 :(得分:2)

带有线性内核的SVM确实是最简单的分类器之一,但如果我们在数据分布可线性分离时获得非常高的性能准确度,那就不足为奇了。

从这个意义上说,我认为你的观点是正确的。但是,您需要意识到SVM的功能在于具有更复杂的非线性内核(例如RBF)的扩展。

choosing classifiers上的一个链接。