在AML Studio实验中使用堆栈时,通常会找到已发布的实验,其中以这种方式构建基本模型:
第一个拆分数据模块提供测试数据集,以对每个基本模型进行最终评估。反过来,它为每个“音调模型超参数”模块提供训练/验证数据集,在这种情况下,该数据集可以在交叉验证模式下工作。 我的问题是关于第二分割数据的需求。随着交叉验证的进行,保持第二分割数据模块的第二输出以获得随后用于训练最终整体模型的得分的理由是什么?换句话说,为什么从第二个分割数据模块的第一个输出中删除第二个分割数据并导出训练/验证和评分数据集似乎不合适,如下所示?
谢谢。