机器学习-寻找界限的目的是什么?

时间:2019-09-27 13:31:06

标签: machine-learning probability

我目前正在Foundations of Machine Learning (Second Edition) textbook的帮助下在大学学习机器学习。我已经了解了PAC学习,Rademacher复杂性,增长函数和VC-Dimension。在整个教科书和整个课程中,我们似乎都在花很多时间寻找界限。

对于为什么要这样做,我有些困惑。

  1. 找到这些界限的重点到底是什么?
  2. 这些限制如何在现实世界中的现场机器学习中实际应用?

无论是教科书还是我的教授都对回答我的问题没有特别帮助。

谢谢。

1 个答案:

答案 0 :(得分:0)

Decision boundary是识别模式的基本原理(将某物分成两套的最简单的视图)。由此,Generalization Bounds为:

  

在统计机器学习的理论中,泛化界线(或更准确地说,是泛化误差界线)是关于学习算法的预测性能的陈述或算法类别。

因此,寻找界限的全部目的是允许您确定算法的性能(或效率)。

这似乎是一个琐碎的问题;答案很简单,因为学习算法可以搜索整个假设空间以寻找最佳解。虽然这个答案是正确的,但鉴于我们正在研究的泛化不等式,我们需要一个更正式的答案。

如果您的问题更像是:为什么花很多时间(所以您要强调花费在此上的时间),或者换句话说:我们为什么需要考虑所有可能的假设?more):

  

这似乎是一个琐碎的问题;答案很简单,因为学习算法可以搜索整个假设空间以寻找最佳解。虽然这个答案是正确的,但鉴于我们正在研究的泛化不等式,我们需要一个更正式的答案。