给定数据集
0 0 1
3 4 1
5 9 1
12 1 1
8 7 1
9 8 -1
6 12 -1
10 8 -1
8 5 -1
14 8 -1
在这些列车数据上应用SVM时,
3 4 1,8 7 1 and 6 12 -1 are missclassified.
这是什么意思 -
数据点3 4是否不属于类标签1但是落在-1中。
是这样的吗?
答案 0 :(得分:1)
是的,这意味着您校准过的模型会产生:
3 4 => -1
8 7 => -1
6 12 => 1
您的错误率为30%。
使用线性判别分析方法,您可以获得20%的错误率。 但请记住,你的人口中没有太多元素(只有10个)。这对于2个描述符来说相对较低。
实际上,如果使用bootstrap方法估计错误率,我们会发现:
判别分析方法的错误率为60%
SVM方法的错误率为55%:SVM通常对过度拟合更有效。
干杯