拆分数据集并进行交叉验证的正确方法是什么?

时间:2019-06-03 20:33:41

标签: machine-learning cross-validation train-test-split

我完全迷失了分割数据集的所有方法。 我拥有数据集,并希望通过交叉验证对其进行评估。

我花了很多时间阅读有关Google的所有主题,但是找不到明确的答案。

我应该:

  1. 将我的数据集分为两部分:X_train和X_test。然后在“ X_train”上运行交叉验证。

  1. 将数据集分为三个部分:X_train,X_val和X_test。并且仅在X_val上运行交叉验证。

但是在第二种情况下,X_train的用途是什么? 我什么时候应该运行GridSearchCV来调整超参数?

然后,X_test的使用是通过交叉验证再次评估我的最终模型(具有已调整的超参数)?

非常感谢!

0 个答案:

没有答案