二进制SVM中的误分类

时间:2013-11-23 06:26:22

标签: java algorithm classification svm

给定数据集

0 0 1
3 4 1
5 9 1
12 1 1 
8 7  1
9 8 -1
6 12 -1
10 8 -1
8 5 -1
14 8 -1

在这些列车数据上应用SVM时,

3 4 1,8 7  1 and 6 12 -1 are missclassified.

这是什么意思 -

数据点3 4是否不属于类标签1但是落在-1中。

是这样的吗?

1 个答案:

答案 0 :(得分:1)

是的,这意味着您校准过的模型会产生:

3 4 => -1

8 7 => -1

6 12 => 1

您的错误率为30%。

使用线性判别分析方法,您可以获得20%的错误率。 但请记住,你的人口中没有太多元素(只有10个)。这对于2个描述符来说相对较低。

实际上,如果使用bootstrap方法估计错误率,我们会发现:

  • 判别分析方法的错误率为60%

  • SVM方法的错误率为55%:SVM通常对过度拟合更有效。

干杯