为什么在模型选择之前没有完成模型调整?

时间:2018-03-10 17:32:41

标签: machine-learning data-mining cross-validation model-comparison

我在很多文章和书中都观察到模型选择是在模型调整之前完成的。

模型选择通常使用某种形式的交叉验证来完成,例如k-fold,其中多个模型'计算指标并选择最佳指标。

然后调整所选模型以获得最佳超参数。

但我的问题是,未选择的模型可能会使用正确的超参数表现更好。

那么为什么我们感兴趣的所有模型都没有调整以获得正确的超参数,然后通过交叉验证选择最佳模型。

1 个答案:

答案 0 :(得分:1)

这取决于每篇文章/书中所遵循的实验设置,但简而言之,在同一实验中执行模型选择+超参数优化的正确方法是使用嵌套交叉验证

  • 评估模型性能的外部循环(像往常一样)
  • 内部循环(再次分割由外循环的N-1个训练分区形成的数据集),在每个折叠中执行超参数优化。

您可以查看this other question以了解有关此验证方案的更多信息。

但请注意,在某些情况下,只需对所有模型进行一般性比较,然后仅优化性能最佳的模型即可。但是,在一项严谨的研究中,这远非理想。