机器学习过拟合如何工作

时间:2020-06-29 12:12:30

标签: machine-learning data-science

数据中的噪声,目标复杂性和训练集的大小与过度拟合如何相关?

1 个答案:

答案 0 :(得分:1)

enter image description here

我猜您是一个初学者,假设您的数据集具有很多功能(如各列所示)。您创建了一个模型并在训练和测试数据集上对其进行了测试,您会注意到该模型在训练集上的准确度为100%,在测试集上的准确度为60-70,这就是过度拟合。这是因为您选择了许多与预测结果无关的功能。

您可以通过删除不相关的列(称为噪声)将其删除,对数据进行K折交叉验证。

该视频可能有助于您更好地了解

https://www.youtube.com/watch?v=Anq4PgdASsc