Question

什么是机器学习中的“合适”？我注意到在某些情况下它是训练的代名词。

有人可以用外行的术语解释吗？

Answer 1

通常使用某种包含参数的功能形式来指定机器学习模型。

一个示例是用于对具有结果变量y的数据进行建模的行，该结果变量可以根据特征x进行描述。在这种情况下，功能形式为：

y = mx + b

拟合模型是指根据训练数据找到m和b的值，该值是一组(x1, y1)，{{ 1}}，...，(x2, y2)。可能无法设置(xN, yN)和m使得该线穿过所有训练数据点，但是可以定义一些损失函数来描述一条合适的线。 fitting 算法的目的是使损失函数最小化。在进行线拟合的情况下，损失可能是训练数据点与该线的总距离，但将损失设置为训练数据点的总平方距离可能在数学上更方便。线。

通常，模型可能比直线更复杂，并且包含许多参数。对于某些模型，参数的数量不是固定的，并且可以在 fitting 过程中进行更改。特征和结果变量可以是离散的，连续的和/或多维的。对于无人监督的问题，没有结果变量。

在所有这些情况下， fitting 仍然类似于上面的示例，在该示例中，运行算法来查找在某种意义上可以解释训练数据的模型参数。这通常涉及运行一些优化过程。

即使其他数据是从与训练数据相同的分布中采样的，也可以很好地拟合训练数据的模型不适合其他非训练数据。可以使用一种称为正则化的技术来解决此问题。

机器学习中的“合适”是什么？

1 个答案: