我知道这将是非常基本的,但是我真的很困惑,我想更好地了解参数调整。
我正在处理一个基准数据集,该数据集已经划分为三个部分,分别进行训练,开发和测试,我想使用GridSearchCV
中的sklearn
调整分类器参数。
什么是调整参数的正确分区?是发展还是训练?
我在文献中看到研究人员提到他们“在开发阶段使用GridSearchCV
调整参数”,发现了另一个例子here;
这是否意味着他们在培训分组中接受培训,然后在开发分组中进行测试?还是ML从业人员通常意味着他们完全在开发阶段执行GridSearchCV?
我非常感谢您的澄清。谢谢,
答案 0 :(得分:0)
通常,在三向拆分中,您使用训练集训练模型,然后在开发集(也称为验证集)上对模型进行验证,以调整超参数,然后在所有调整完成后执行最终在未见过的测试集(也称为评估集)上对模型进行评估。
在双向拆分中,您只有一个训练集和一个测试集,因此您可以对同一测试集执行调整/评估。