我目前正在Foundations of Machine Learning (Second Edition) textbook的帮助下在大学学习机器学习。我已经了解了PAC学习,Rademacher复杂性,增长函数和VC-Dimension。在整个教科书和整个课程中,我们似乎都在花很多时间寻找界限。
对于为什么要这样做,我有些困惑。
无论是教科书还是我的教授都对回答我的问题没有特别帮助。
谢谢。
答案 0 :(得分:0)
Decision boundary是识别模式的基本原理(将某物分成两套的最简单的视图)。由此,Generalization Bounds为:
在统计机器学习的理论中,泛化界线(或更准确地说,是泛化误差界线)是关于学习算法的预测性能的陈述或算法类别。
因此,寻找界限的全部目的是允许您确定算法的性能(或效率)。
这似乎是一个琐碎的问题;答案很简单,因为学习算法可以搜索整个假设空间以寻找最佳解。虽然这个答案是正确的,但鉴于我们正在研究的泛化不等式,我们需要一个更正式的答案。
如果您的问题更像是:为什么花很多时间(所以您要强调花费在此上的时间),或者换句话说:我们为什么需要考虑所有可能的假设?(more):
这似乎是一个琐碎的问题;答案很简单,因为学习算法可以搜索整个假设空间以寻找最佳解。虽然这个答案是正确的,但鉴于我们正在研究的泛化不等式,我们需要一个更正式的答案。