我是机器学习的新手。我有一个关于使用一个特征的多项式回归的问题。
我的理解是,如果有一个输入要素,我们可以通过采用正方形和立方体来创建一个假设函数。
假设x1是输入特征,我们的假设函数就像这样:
htheta(x)= theta0 +(theta1)x1 +(theta2)x1 ^ 2 +(theta3)x1 ^ 3.
我的问题是这种情况的用例是什么?在什么类型的数据中,这种假设函数会有帮助吗?
答案 0 :(得分:2)
此方案适用于简单的曲线拟合问题。例如,你可能有一个弹簧,想要知道弹簧拉伸的程度与你施加的力有多大(弹簧不必是符合胡克定律的弹簧)。您可以通过收集一系列不同力的测量值来建立模型,这些测量值应用在弹簧上(以牛顿为单位),以及以厘米为单位的弹簧伸展(也称为位移)。然后,您可以构建形式为F(x)= theta_1 * x + theta_2 * x ^ 3 + theta_3 * x ^ 5的模型,并拟合三个theta参数。你当然可以解决任何其他单变量问题(身高与年龄,体重与血压,电流与电压的关系)。实际上,你通常拥有的不仅仅是一个因变量。
另外值得指出的是,变换在因变量(本例中为x)中不一定是多项式的。你也可以尝试日志,平方根,指数等。如果你问为什么它总是一个参数乘以输入变量的函数,这更像是一个建模选择而不是任何东西(特别是一个线性模型,因为它是线性的在theta)。它不一定是这种方式,是一个限制函数类的简单假设。线性模型还满足一些直观的统计特性,这也证明了它们的使用(参见here)