机器学习中的“合适”是什么?

时间:2020-07-19 04:18:19

标签: machine-learning data-science

什么是机器学习中的“合适”?我注意到在某些情况下它是训练的代名词。

有人可以用外行的术语解释吗?

1 个答案:

答案 0 :(得分:1)

通常使用某种包含参数的功能形式来指定机器学习模型。

一个示例是用于对具有结果变量y的数据进行建模的行,该结果变量可以根据特征x进行描述。在这种情况下,功能形式为:

y = mx + b

拟合模型是指根据训练数据找到mb的值,该值是一组(x1, y1),{{ 1}},...,(x2, y2)。可能无法设置(xN, yN)m使得该线穿过所有训练数据点,但是可以定义一些损失函数来描述一条合适的线。 fitting 算法的目的是使损失函数最小化。在进行线拟合的情况下,损失可能是训练数据点与该线的总距离,但将损失设置为训练数据点的总平方距离可能在数学上更方便。线。

通常,模型可能比直线更复杂,并且包含许多参数。对于某些模型,参数的数量不是固定的,并且可以在 fitting 过程中进行更改。特征和结果变量可以是离散的,连续的和/或多维的。对于无人监督的问题,没有结果变量。

在所有这些情况下, fitting 仍然类似于上面的示例,在该示例中,运行算法来查找在某种意义上可以解释训练数据的模型参数。这通常涉及运行一些优化过程。

即使其他数据是从与训练数据相同的分布中采样的,也可以很好地拟合训练数据的模型不适合其他非训练数据。可以使用一种称为正则化的技术来解决此问题。