我为一个班级提供了~100个数据元素,为另一个班级提供了~6000个数据元素。当我使用数据创建一个svm时,它只返回我尝试预测的每个新元素的多数类别标签。有没有办法用sklearn svm惩罚少数类别的错误分类,这样我才能真正使用我的所有数据元素而不必从大多数类别中抽取100个元素用于测试?
答案 0 :(得分:1)
SVC具有以下参数可供您使用
class_weight : {dict, 'auto'}, optional
Set the parameter C of class i to class_weight[i]*C for
SVC. If not given, all classes are supposed to have
weight one. The 'auto' mode uses the values of y to
automatically adjust weights inversely proportional to
class frequencies.