我正在研究多类分类(10个类)。我正在使用sklearn.linear_model.SGDClassifier。我看到该模型使用了一种“所有人对所有人”的方法。 SGDClassifier有一个参数class_weight:“与类关联的权重。如果未给出,则所有类的权重都应为一。
“平衡”模式使用y的值来自动调整与输入数据中的类频率成反比的权重,即n_samples /(n_classes * np.bincount(y))。“在训练期间如何使用class_weight?例如,我们有标签A-5个样本,标签B-15个样本和标签C-100个样本。假设模型A与B和C处于训练状态。是否在损失函数的计算中包括了class_weights? “?SGDClassifier具有“准确性”作为默认评分选项。是否加权?