我正在使用
linear_model.SGDClassifier(loss='log',class_weight='balanced')
用于10个类别的分类(类别非常不平衡)。
看来class_weight仅在训练时使用(在loss函数中)。它们不用于评分。 因此,我正在使用
GridSearchCV(test_model, my_hyperparameters, scoring='f1_macro')
由于'f1_macro',它会计算“每个标签的指标,并找到其未加权平均值。这不会考虑标签的不平衡。”
我想使用“ neg_log_loss”作为得分。因此,我将拥有:
GridSearchCV(test_model, my_hyperparameters, scoring='neg_log_loss')
。
是否可以加权?
在文档中,我看到:
sklearn.metrics.log_loss(y_true, y_pred, eps=1e-15, normalize=True, sample_weight=None, labels=None)
。
但是如何在
中传递“ sample_weight” GridSearchCV(test_model, my_hyperparameters, scoring='neg_log_loss')
?