标签: scikit-learn classification svm
我正在使用sklearn库中的SVC处理二进制分类问题。数据不平衡。我尝试了两种方法来解决此问题: 1.在SVC中设置参数class_weight(增加少数群体的权重)。 2.对少数类进行过度采样(重复多次)。
但是,两种方法的结果是不同的。第二种方法比第一种方法获得更高的分数(准确性,回忆性和f1)。
有人知道一些可能的原因吗?
谢谢!