标签: machine-learning data-science
数据中的噪声,目标复杂性和训练集的大小与过度拟合如何相关?
答案 0 :(得分:1)
我猜您是一个初学者,假设您的数据集具有很多功能(如各列所示)。您创建了一个模型并在训练和测试数据集上对其进行了测试,您会注意到该模型在训练集上的准确度为100%,在测试集上的准确度为60-70,这就是过度拟合。这是因为您选择了许多与预测结果无关的功能。
您可以通过删除不相关的列(称为噪声)将其删除,对数据进行K折交叉验证。
该视频可能有助于您更好地了解
https://www.youtube.com/watch?v=Anq4PgdASsc