我试图在sklearn中使用SVM模型的SVC分类器。我已经学会在各种数据集上使用它,甚至应用gridsearch来改进结果,但我还没有理解一些参数,如C,gamma。
如果有人能给我简单但详细解释每个参数,那就太棒了。
答案 0 :(得分:1)
由于我们试图最小化某些目标函数,我们可以在函数中添加系数向量本身的一些“大小”度量。 C基本上是“正则化”项的权重的倒数。降低C将通过强制系数稀疏或小来防止过度拟合,这取决于惩罚。过多地增加C会促进不足之处。
Gamma是RBF内核的参数。增加伽马值可以实现更复杂的决策边界(这可能导致过度拟合,但也可以改善结果 - 这取决于数据)。
This scikit-learn tutorial以图形方式显示更改两个超参数的效果。