一类支持向量机

时间:2011-07-28 22:30:53

标签: machine-learning cluster-analysis analytics data-mining svm

所以我想确保我有这个权利。首先,我是一名本科计算机工程专业,拥有比软件更多的硬件/ EE经验。今年夏天,我发现自己使用了一种使用一类SVM的聚类算法。 SVM只是用于分类/分离输入数据的数学模型吗? SVM在具有一个属性/变量的数据集上运行良好吗?我猜对后者,可能是因为具有单一属性的分类实际上是刻板印象。我的猜测是SVM在具有多个属性/变量以有助于分类的数据集上表现更好。提前致谢!

1 个答案:

答案 0 :(得分:4)

SVM尝试构建超平面分隔2个类(AFAIK,在单类SVM中,有一个类用于“普通”,一个类用于“异常”实例)。只有一个属性,您有一维空间,即。因此,这里的超平面是线上的。如果2个类的实例(该行上的点)可以被该超平面点分开(即它们是线性可分的),则可以使用SVM。否则不是。

注意,使用几个属性,SVM仍可用于对线性不可分离的实例进行分类。在下一个图像中,二维空间中有2个类(2个属性 - X和Y),一个标有蓝点,另一个标有绿色。

enter image description here

您无法绘制可以分隔它们的线条。尽管如此,所谓的kernel trick可以通过组合现有来产生更多的属性。使用更多属性,您可以获得更高维度的空间,其中所有实例可以分开(video)。不幸的是,一个属性不能与自身结合,因此对于一维空间,内核技巧不适用。

因此,您的问题的答案是: SVM可以在只有一个属性的集合上使用,当且仅当2个类的实例可以自己线性分离时