我知道R平方的这种解释,但是,我必须用均方根误差进行解释。
例如:对于训练集,我具有2度32.5、3度29.2、4度27.5的均方根误差。另一方面,对于验证集,我具有2度34.2、3度32.3、4度35.8的均方根误差。我对此有一些解释,我猜想4级学位过拟合,但2级和3级学位我什么也不能解释。
答案 0 :(得分:0)
您的情况下的程度代表模型的复杂性。随着您增加复杂性,该模型通常会在训练集上表现更好-RMSE将下降。此外,随着模型变得更加复杂,验证集的性能通常会提高,因为它能够更好地捕获数据中的模式。但这只持续到某个时候。当您的模型变得过于复杂(对于您而言,度数太高)时,它将过于紧缩地复制数据,并且无法将其概括化-在训练期间未看到的数据上,其性能会受到影响。看不见的数据是您的验证集。在您的情况下,从2级到3级的复杂性提高了训练集和验证集的性能。但是,当您尝试4度模型时,其在验证集上的性能下降。那是过度拟合的标志。