我正在研究机器学习项目,并且使用xgboost学习API。
我将数据集分为三个部分: dtrain,dval,dtest(这些是DMatrix格式)。
我在dtrain上执行xgb.cv()来检查我的超参数是否正确。它打印火车和测试错误。
然后,我在xgb.train中使用监视列表(dtrain:“培训”,dval:“验证”)来检查效果。
最后,我在dtest集上执行xgb.predict()。
我不确定我是否正确理解监视列表的工作方式。
我的问题是:监视列表和简历是否具有相同用途?我是否一无所有地拆分dval(验证集)并丢失了大量数据?我的数据集不多,所以如果可以避免浪费数据,那就更好了!
感谢您的回答:)