应用错误收集

正如您正确指出的那样，训练错误本身可能是您模型性能的一个非常糟糕的指标。但是，你不需要训练你的模型来进行一些有意义的预测。

这就是您需要培训，验证以及测试阶段和数据集的原因。通过使用随机子采样验证数据集，可以在一定程度上缓解训练数据集中容易发生的过度拟合，因为如果您已经过度拟合，则您的模型将不会推广（您应该看到您的训练误差单调下降为模型复杂性增加，但您的验证错误在某些时候出现平台，而额外的模型复杂性实际上增加了验证错误）。但是，如果您不对模型进行任何培训，则表示您没有要验证的模型！

模型需要经过培训。没有绕过那个。但是，训练错误我自己也没用。需要执行交叉验证以确保模型可推广。底线是您使用的任何模型在培训阶段所看到的，以评估其性能无效。它适用于模型拟合，但不适用于评估。无论OP在下面的讨论中声称什么，正确的方法是交叉验证。

你应该研究偏差 - 方差权衡的概念，因为这与你的问题有直接关系，应该澄清你的疑问。

训练错误 - 重点是什么？

1 个答案: