标签: machine-learning cross-validation train-test-split
我完全迷失了分割数据集的所有方法。 我拥有数据集,并希望通过交叉验证对其进行评估。
我花了很多时间阅读有关Google的所有主题,但是找不到明确的答案。
我应该:
或
但是在第二种情况下,X_train的用途是什么? 我什么时候应该运行GridSearchCV来调整超参数?
然后,X_test的使用是通过交叉验证再次评估我的最终模型(具有已调整的超参数)?
非常感谢!