Question

对于使用CatBoostClassifer使用最佳模型对测试数据集进行预测，我感到困惑。

首先，我使用以下代码训练了模型：-

model = CatBoostClassifier(eval_metric='AUC',random_seed=42,use_best_model=True,verbose=1)

model.fit(X_train, y_train,cat_features=categorical_features_indices,eval_set=(X_validation, 
          y_validation),plot=True);

我得到的分数为bestTest = 0.8291620043

接下来，我使用以下代码进行交叉验证：-

cv_params = model.get_params()
cv_params.update({'loss_function': 'Logloss'})
cv_data = cv(Pool(X, y, cat_features=categorical_features_indices),cv_params,fold_count=10,)

我的最佳成绩是0.832801311

现在，我想使用最佳评分模型进行预测。目前，我正在predictions = model.predict(X_test)

我在这里使用最佳评分模型吗？

无论我的模型是来自简历还是普通模型，我都很困惑。

如果我想念这里或做错什么，请给我建议。

如何在catboost分类器中对交叉验证的数据集使用预测？

0 个答案: