我应该使用什么机器学习算法?

时间:2014-03-06 18:56:53

标签: algorithm machine-learning artificial-intelligence regression

我正在尝试编写一种算法来估计我知道系统的物体的质量。

我的数据是x和y点的形式,所以我可以将它们表示为多个x和y点,或者通过表示x和y点的平均值和偏差来表示。这可能取决于算法的参数。

我不需要分类器,我正在寻找数值估算。

例如,x值:{1,2,3,...},y值:{1,2,3,...} - >质量:5, 或x值:{2(mean),1(std)} y:{2,1} - > 5

我对机器学习很陌生,分类器似乎不是解决这个问题的方法,而我查找的回归学习算法似乎试图估算参数,而不是结果。

我也计划用Python做这件事,但我不需要包或其他东西,一般的算法应该让我走上正轨。

编辑以响应blubb

我的数据以一组x点,一组y点和一个质量的形式给出。 例如,

x values   |   y values   | mass
--------------------------------
1 2 3 4    |   1 2 3 4    | 6.7
2 3 4 5    |   2 3 4 5    | 7.9

我会收到一个输入,例如:

x values   |   y values
-----------------------
5 6 7      |   8 9 10

另一种反感它的方式(可能在向量空间方面很聪明)就是用手段和标准来表示值,所以我的训练数据会变成:

x mean | x std | y mean | y std | mass
--------------------------------------
2.5    | 1     | 2.5    | 1     | 6.7
3.5    | 1     | 3.5    | 1     | 7.9

这些显然不是真正的价值观,而是代表性的例子。 (所有值都是浮点数)

1 个答案:

答案 0 :(得分:4)

您正在寻找估算函数f: R² -> R,因此回归是您应该研究的方法系列。然而,哪种回归在很大程度上取决于(x, y)mass之间的关系。

一般而言,回归方法定义了成本函数c: R² x F -> R+和一组F个函数可供选择。集合F通常是无限的,并以某种形式进行参数化。这使得大多数回归方法都存在估算最佳f(您称之为“估计参数”)的参数的问题。

为了确定哪种回归方法最合适,您必须找出以下内容:

  • 什么是有意义的费用函数c
  • 如何选择功能集F

例如,线性回归选择线性最小二乘成本函数,并将定义F设置为所有线性函数f: R² x R的集合。这可能是您想要的,也可能不是,这取决于您的设置。

因此,解释可以确定三元组(x, y, mass)的实验设置可能有助于阐明这一点。