我正在使用LibSVM在高度不平衡的数据集上训练SVM。 10%的输出为真,而90%为假。我读到了重量参数:
-wi weight: set the parameter C of class i to weight*C, for C-SVC (default 1)
每个类的参数设置应该是什么?这个权重参数的直观含义是什么?我们应该如何使用它?
答案 0 :(得分:4)
权重参数控制SVM优化的偏差。也就是说,体重较高的课程会更多。如果一个类的权重是另一个类的3倍,那么较低权重类的实例可以是libsvm确定为另一个类的实例的类之间的边界的3倍。同样的优化价值。
你如何使用它完全取决于你 - 你可以设置它使得两个类具有相同的权重(即真实的权重为9),但如果你得到的结果实际上改善了使用它权重是另一回事。
我建议你玩不同的重量来看看会发生什么。