我正在使用svm light来训练二进制分类模型。使用该模型,我测试了一些例子。我很惊讶地看到预测文件的输出,它包含大于1的值以及小于-1的值。我以为范围是[-1,1]。我做错了吗?
答案 0 :(得分:2)
如果您了解SVM的工作原理,那么为什么值不受[-1,1]的区间限制是有道理的。 SVM尝试绘制分隔负数据点和正数据点的线,同时最大化它们与线的距离。
预测文件中的值表示来自SVM最佳超平面的数据距离,其中正值在超平面的正类侧,而负值在超平面的负类侧。这些距离可以任意大或小,并且不受限制,如该图像所示:
我已经看到了一些SVM实现,例如Weka's implementation Platt's SMO,它们对值进行了规范化,使得它们是由[0,1]的区间限定的正类的置信值,但是两种方式都可以很好地确定SVM对分类的信心,因为超平面的数据点比超平面附近的数据点更加确定。