关于内核函数和支持向量机使用的术语的特定查询

时间:2012-08-02 20:02:34

标签: mapping kernel machine-learning svm

我目前正在阅读Nello Cristianini撰写的“支持向量机和其他基于内核的方法的介绍”一书,我无法理解他在第2章和第2章中讨论的线性学习机的双重表示概念。后来也在第3.2节“隐式映射到特征空间”的第3章中,我不知道这种双重表示是一般概念还是它是本书特有的命名约定。所以这就是为什么我特别引用这本书和该部分,如果有人已经读过它。如果这是一般概念,但是如果有人能够澄清线性学习机的双重表示意味着什么以及这种双重表示的优点是什么,我将不胜感激?

我希望这个问题不是太模糊,但遗憾的是我没有这些概念的背景或理解来进一步阐述我的问题。

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:3)

这是一般概念,并不是本书所特有的。

双重问题的主要好处是数据点仅出现在点积内。每对数据点的点积通常表示在核矩阵中。如果使用不同类型的内核,则会得到不同类型的分类器(点:线性,rbf,:rbf网络等)。这被称为核心技巧(或者像你正在阅读的书籍似乎称之为隐式映射到特征空间),这是过去十年中机器学习中最重要的突破之一。

并非所有内容都可以成为内核。核矩阵需要是正半确定的。维基百科上的kernel trick上有一篇很棒的文章。此外,不仅可以对L2正则化二进制分类器(SVM)进行内核化,还有内核感知器,内核PCA,内核所有内容。