如何从LogisticRegressionCV的输出中选择C应用于多类问题

时间:2018-09-10 13:23:34

标签: scikit-learn logistic-regression

此问题与“ sklearn LogisticRegressionCV是否将所有数据用于最终模型”(Does sklearn LogisticRegressionCV use all data for final model)有关。对于在二进制分类的情况下LogisticRecgressionCV的工作方式(尤其是如何选择C),答案是至关重要的:“对于C的每个值,请对提供的数据进行交叉验证,其中LogisticRegression将适合训练数据。对所有当前折叠的得分进行评分,并在测试数据上打分。对所有折叠的测试数据的得分进行平均,然后得出当前C的得分。这是针对您提供的所有C值,以及得分最高的C将被选中。” 我的问题是...在多类情况下,如何选择最佳的C超参数?在这种情况下,将获得一个C数组,该数组映射到每个班级的最佳成绩。如何从C_数组元素中选择或计算最佳的C,该C可用于最终的多类分类模型?

0 个答案:

没有答案