应用错误收集

我正在研究多类分类（10个类）。我正在使用sklearn.linear_model.SGDClassifier。我看到该模型使用了一种“所有人对所有人”的方法。 SGDClassifier有一个参数class_weight：“与类关联的权重。如果未给出，则所有类的权重都应为一。

“平衡”模式使用y的值来自动调整与输入数据中的类频率成反比的权重，即n_samples /（n_classes * np.bincount（y））。“在训练期间如何使用class_weight？例如，我们有标签A-5个样本，标签B-15个样本和标签C-100个样本。假设模型A与B和C处于训练状态。是否在损失函数的计算中包括了class_weights？ “？SGDClassifier具有“准确性”作为默认评分选项。是否加权？

sklearn.linear_model.SGDClassifier如何用于多类分类？

1 个答案: