我有一个不平衡的数据,我想在matlab上使用LibSVM。 LibSVM有两个不同的成本参数:-c和-wi。他们之间有什么区别?
答案 0 :(得分:0)
-c 选项是设置超参数值。由于您有不平衡的数据,因此与具有较少示例数的类相比,它尝试将具有大量示例的类的错误最小化。
现在,单向是以某种方式向算法建议,与其他类相比,具有较少数量示例的类的错误应该被赋予更多权重。您可以使用 -w 选项执行此操作
说:你有两个班级+1和-1。与-1级相比,+1个例子的数量更少。所以,你想要给予+1级更多的权重。现在,您可以将参数设置为,
-w+1 10 -c C
表明在二元分类中,正类的误差应该比负类的重量大约多10倍
使用交叉验证技术选择与 -c 和 -w 一起使用的值。