如何优雅地将Sklearn的GridseachCV的最佳参数传递给另一个模型?

时间:2017-07-13 07:57:43

标签: python machine-learning scikit-learn grid-search hyperparameters

我通过网格搜索简历为我的KNN估算器找到了一组最佳超参数:

>>> knn_gridsearch_model.best_params_
{'algorithm': 'auto', 'metric': 'manhattan', 'n_neighbors': 3}

到目前为止,这么好。我想用这些新发现的参数训练我的最终估算器。有没有办法直接提供上面的超参数字典?我试过这个:

>>> new_knn_model = KNeighborsClassifier(knn_gridsearch_model.best_params_)

但是希望的结果new_knn_model只是将整个dict作为模型的第一个参数,并将其余的作为默认值:

>>> knn_model
KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',
           metric_params=None, n_jobs=1,
           n_neighbors={'n_neighbors': 3, 'metric': 'manhattan', 'algorithm': 'auto'},
           p=2, weights='uniform')

确实令人失望。

2 个答案:

答案 0 :(得分:22)

您可以按照以下方式执行此操作:

new_knn_model = KNeighborsClassifier()
new_knn_model.set_params(**knn_gridsearch_model.best_params_)

或者直接解压缩为@taras建议:

new_knn_model = KNeighborsClassifier(**knn_gridsearch_model.best_params_)

顺便说一下,在完成网格搜索之后,网格搜索对象实际上保留了(默认情况下)最佳参数,因此您可以使用该对象本身。或者,您也可以通过

访问具有最佳参数的分类器
gs.best_estimator_

答案 1 :(得分:0)

我只想指出使用grid.best_parameters并通过unpacking将其传递给新模型,如:

my_model = KNeighborsClassifier(**grid.best_params_)

很好,而且我个人经常使用它 但是,正如您在文档here中看到的那样,如果您的目标是使用这些best_parameters预测某些内容,则可以直接使用grid.predict方法,默认情况下会为您使用这些最佳参数。

示例:

y_pred = grid.predict(X_test)

希望这有用。