背景
让我们说,我们有L
个标签来预测多类(相应的多标签)问题。使用OneVsRestClassifier
,正在构建L
个分类器。我们假设,我们将LogisticRegression
用于各个分类器。
使用GridSearchCV
(分别为RandomizedSearchCV
)搜索最佳超参数时,我们运行:
GridSearchCV( OneVsRestClassifier( LogisticRegression(), ...) ).fit(X, y)
问题
通过运行上面的GridSearchCV
命令,我们将获得一组最佳超参数,用于训练(分别重新编译)所有L
分类器。因此,例如,我们将获得C=10
的最佳值,该值将用于重新设置L
分类器的所有。
我的问题是为什么GridSearchCV
没有为每个L
分类器返回一组不同的最佳超参数。例如。 label0
最优C=10
,label1
会获得最佳C=0.01
,......?
为什么决定返回一组超级参数而不是每个分类器的一组?
之前的经验
我在问,因为这种行为与我在培训每个标签分类器时通常会得到的行为不同#39;例如。对于某些任务,我需要预测数千个标签,我会单独训练每个标签分类器(分布在许多机器上),因此,我肯定会得到每个标签分类器的不同超参数值。