对于使用CatBoostClassifer使用最佳模型对测试数据集进行预测,我感到困惑。
首先,我使用以下代码训练了模型:-
model = CatBoostClassifier(eval_metric='AUC',random_seed=42,use_best_model=True,verbose=1)
model.fit(X_train, y_train,cat_features=categorical_features_indices,eval_set=(X_validation,
y_validation),plot=True);
我得到的分数为bestTest = 0.8291620043
接下来,我使用以下代码进行交叉验证:-
cv_params = model.get_params()
cv_params.update({'loss_function': 'Logloss'})
cv_data = cv(Pool(X, y, cat_features=categorical_features_indices),cv_params,fold_count=10,)
我的最佳成绩是0.832801311
现在,我想使用最佳评分模型进行预测。
目前,我正在predictions = model.predict(X_test)
我在这里使用最佳评分模型吗?
无论我的模型是来自简历还是普通模型,我都很困惑。
如果我想念这里或做错什么,请给我建议。