是否有任何特定的数据行为导致过拟合和过拟合?

时间:2019-11-06 05:16:53

标签: machine-learning artificial-intelligence linear-regression data-science gradient-descent

由于我是数据科学的新手,我只想知道是否有任何特定的数据行为导致过拟合和/或欠拟合?因为如果要处理线性回归,我们应该通过梯度下降得到最佳拟合线。现在,我们如何过拟合或欠拟合?我知道什么是过度拟合和不足拟合,但是问题是,当您已经应用梯度下降以获得最佳拟合线时,怎么可能。希望我的问题能被所有人解决。

感谢和问候。

2 个答案:

答案 0 :(得分:0)

数据中样本数量少可能是模型过度拟合的主要原因。即使您的模型简单,数据样本中较少的方差(或变异)也可以使模型“仅”对这些样本学习良好的性能,并且可能无法很好地泛化。

答案 1 :(得分:0)

我们可以通过查看no来检测线性模型上的过度拟合。功能,训练错误以及测试错误的说明。

如果模型过拟合:
1.提供了足够的数据用于培训,即没有。用于训练的功能。
2.训练误差小于测试误差。

如果模型适合:
1.为培训提供的数据较少,即没有。用于训练的功能。
2.测试错误远小于训练错误。

使用“梯度下降”是一个不错的选择,但可能会导致“过度拟合”并导致真实数据失败。

希望这会有所帮助。