GridSearchCV(OneVsRestClassifier(clf,...)):所有N个分类器的1个最佳超参数集与每个分类器的1个最优集

时间:2015-11-16 20:00:10

标签: scikit-learn multilabel-classification grid-search

背景

让我们说,我们有L个标签来预测多类(相应的多标签)问题。使用OneVsRestClassifier,正在构建L个分类器。我们假设,我们将LogisticRegression用于各个分类器。

使用GridSearchCV(分别为RandomizedSearchCV)搜索最佳超参数时,我们运行:

GridSearchCV( OneVsRestClassifier( LogisticRegression(), ...) ).fit(X, y)

问题

通过运行上面的GridSearchCV命令,我们将获得一组最佳超参数,用于训练(分别重新编译)所有L分类器。因此,例如,我们将获得C=10的最佳值,该值将用于重新设置L分类器的所有

我的问题是为什么GridSearchCV没有为每个L分类器返回一组不同的最佳超参数。例如。 label0最优C=10label1会获得最佳C=0.01,......? 为什么决定返回一组超级参数而不是每个分类器的一组?

之前的经验

我在问,因为这种行为与我在培训每个标签分类器时通常会得到的行为不同#39;例如。对于某些任务,我需要预测数千个标签,我会单独训练每个标签分类器(分布在许多机器上),因此,我肯定会得到每个标签分类器的不同超参数值。

0 个答案:

没有答案