支持向量机:什么是C&伽玛?

时间:2016-03-07 15:56:56

标签: machine-learning svm

我是机器学习7的新手我已经开始关注Udacity的Intro to Machine Learning

C and Gamma的这个概念出现时,我正在关注Simple Vector Machine。我做了一些挖掘,发现了以下内容 -

C -  A high C tries to minimize the misclassification of training data
and a low value tries to maintain a smooth classification. This makes sense to me.

Gamma - I am unable to understand this one.

有人可以用外行的方式向我解释这个吗?

3 个答案:

答案 0 :(得分:3)

当您使用SVM时,您必须使用其中一个内核:线性,polinomial或RBF =径向基函数(也称为高斯内核)或....后者是

K(x,x') = exp(-gamma * ||x-x'||^2) 

明确包含您的伽玛。伽玛越大,高斯"贝尔"是

我相信,随着课程的进行,您将了解更多关于此类"内核技巧"。

答案 1 :(得分:3)

直观地,伽玛参数定义了单个训练样例的影响达到了多远,低值意味着“远”,高值意味着“接近”。伽马参数可以被视为由模型选择的样本作为支持向量的影响半径的倒数。 C参数将训练样例的错误分类与决策表面的简单性相对应。低C使得决策表面平滑,而高C旨在通过给予模型自由选择更多样本作为支持向量来正确地对所有训练示例进行分类。 http://scikit-learn.org/stable/auto_examples/svm/plot_rbf_parameters.html

答案 2 :(得分:1)

-C参数:C确定允许将多少数据样本放在不同的类中。如果C的值被设置为低值,则异常值的概率增加,并且找到一般决策边界。如果C的值设置为高,则更仔细地找到决策边界。

C用于软边距,这需要了解松弛变量。

- 软边距分类:Φ(w)=½wTw+CΣξi

-slack variables(ξi):ξi确定要调整多少边距。

gamma参数:gamma确定单个数据样本施加影响的距离。也就是说,可以说伽玛参数可以调整决策边界的曲率。