SciKit-Learn:网格搜索CV录制时间?

时间:2017-07-25 16:20:06

标签: python scikit-learn grid-search

我正在做一些基本的机器学习,并希望对XGBoost进行网格搜索(以找到最佳的超参数)。这就是我正在做的事情:

act

所以我开始在我的Jupyter笔记本中输出如下:

from sklearn.metrics import classification_report
from sklearn.pipeline import Pipeline
from sklearn.grid_search import GridSearchCV
import xgboost as xgb

pipeline = Pipeline([('clf', xgb.XGBRegressor(silent=False))])
parameters = {
'clf__n_estimators': (500, 1000), 
    'clf__learning_rate': (0.01, 0.05, 0.1),
    'clf__max_depth': (10, 20, 30)
}

grid_search = GridSearchCV(pipeline, parameters, n_jobs=-1,verbose=2, scoring='neg_mean_absolute_error')
grid_search.fit(X, y)

一切似乎都很好,但它会经历所有组合并且不会终止。相反,它开始打印以下内容:

Fitting 3 folds for each of 18 candidates, totalling 54 fits
[CV] clf__max_depth=10, clf__learning_rate=0.01, clf__n_estimators=500 

这是什么意思?我期待网格搜索能够执行54次匹配并完成,但之后似乎还在做其他事情?

感谢您的帮助!

0 个答案:

没有答案