我现在使用libsvm作为支持向量机分类器与高斯核心。在its website中,它提供了一个python脚本grid.py来选择最佳的C和gamma。
我只是想知道训练时间和过度拟合/欠拟合如何随着伽马和C变化?
是否正确:
假设C从0变为+无穷大,经过训练的模型会从欠拟合变为过度拟合,训练时间会增加吗?
假设伽马值从几乎0变为+无穷大,训练后的模型会从欠拟合变为过度拟合,训练时间会增加吗?
在grid.py中,默认搜索顺序是针对C从小到大的BUT伽玛从大到小。它是为了训练从小到大训练时间从过度拟合到过度拟合的模型吗?那么我们可以节省选择C和gamma值的时间吗?
谢谢和问候!
答案 0 :(得分:1)
我没有确定答案的好问题,因为我自己想知道。但是回答这个问题:
因此,我们可以节省选择C和伽玛值的时间吗?
...我发现,对于libsvm,C和gamma肯定有一个“正确”的值,它非常依赖于问题。因此,无论搜索伽马的顺序如何,都必须测试伽马的许多候选值。最后,我不知道这个耗时的任何捷径(取决于你的问题),但必要的参数搜索。