如何在catboost分类器中对交叉验证的数据集使用预测?

时间:2020-04-21 11:43:17

标签: python catboost

对于使用CatBoostClassifer使用最佳模型对测试数据集进行预测,我感到困惑。

首先,我使用以下代码训练了模型:-

model = CatBoostClassifier(eval_metric='AUC',random_seed=42,use_best_model=True,verbose=1)

model.fit(X_train, y_train,cat_features=categorical_features_indices,eval_set=(X_validation, 
          y_validation),plot=True);

我得到的分数为bestTest = 0.8291620043

接下来,我使用以下代码进行交叉验证:-

cv_params = model.get_params()
cv_params.update({'loss_function': 'Logloss'})
cv_data = cv(Pool(X, y, cat_features=categorical_features_indices),cv_params,fold_count=10,)

我的最佳成绩是0.832801311

现在,我想使用最佳评分模型进行预测。 目前,我正在predictions = model.predict(X_test)

我在这里使用最佳评分模型吗?

无论我的模型是来自简历还是普通模型,我都很困惑。

如果我想念这里或做错什么,请给我建议。

0 个答案:

没有答案