如果我们将数据随机地分成训练数据和验证数据,并假设训练数据和验证数据具有类似的分布",即它们都是整个数据集的良好表示。
在这种情况下,如果没有过度拟合,验证准确度是否应始终与训练准确度大致相同?或者,在某些情况下,是否有可能在培训和验证准确性之间存在差距,而这种差距不是由于过度拟合或验证数据的错误表示?
如果存在这种差距,如何判断训练和验证准确性之间的差距是由于过度拟合还是其他原因造成的?
答案 0 :(得分:1)
这两个并不真正重要,如果我理解正确,你会要求训练准确性更高而没有过度拟合或机会发挥作用的情况。我不认为存在这样的理由。