sklearn.linear_model.SGDClassifier如何用于多类分类?

时间:2019-01-14 21:45:13

标签: machine-learning scikit-learn multiclass-classification

我正在研究多类分类(10个类)。我正在使用sklearn.linear_model.SGDClassifier。我看到该模型使用了一种“所有人对所有人”的方法。 SGDClassifier有一个参数class_weight:“与类关联的权重。如果未给出,则所有类的权重都应为一。

“平衡”模式使用y的值来自动调整与输入数据中的类频率成反比的权重,即n_samples /(n_classes * np.bincount(y))。“在训练期间如何使用class_weight?例如,我们有标签A-5个样本,标签B-15个样本和标签C-100个样本。假设模型A与B和C处于训练状态。是否在损失函数的计算中包括了class_weights? “?SGDClassifier具有“准确性”作为默认评分选项。是否加权?

1 个答案:

答案 0 :(得分:0)

这是我的理解。 分类器优化以下目标函数: enter image description here

L是损失函数,w是类权重。损失函数是用户定义的参数。