算法结合数据线性拟合?

时间:2012-06-29 15:12:15

标签: algorithm regression correlation genetic

我不确定这是不是最好问这个问题的地方,但是你们过去一直对我的CS作业很有帮助,所以我想我会试一试。

我正在寻找一种算法,盲目地将几个因变量组合成一个索引,该索引与外部变量产生最佳线性拟合。基本上,它会使用不同的数学运算符组合因变量,包括或不包括每一个,等等,直到开发出与我的外部变量最佳相关的索引。

有没有人见过/听说过这样的事情?即使你能指出我正确的方向或正确的地方,我也会很感激。感谢。

3 个答案:

答案 0 :(得分:1)

听起来你正在尝试做多元线性回归或多元回归。执行此操作的最简单方法(读取:不太准确)是单独计算每个组件变量的线性回归线,然后对每条线进行加权平均。除此之外,我担心我会得到一些帮助。

答案 1 :(得分:0)

这似乎是使用多个解释变量的简单线性回归。这里的含义是您使用计算方法,您可以使用您的解释变量的每个可能组合将线性模型应用于您的数据(无论您是否要包含交互)效果是你的选择),选择合适的度量(R ^ 2只是一个例子)并使用它来排列你适合的每个模型的拟合?模型的质量在许多领域也有些主观 - 你可以拒​​绝一个包含15个变量的模型,如果它只是适度地改进了对仅包含3个变量的简单模型的拟合。如果您还没有阅读,我不怀疑您会在以下文本中找到许多有用的建议:

Draper,N.R。和Smith,H。(1998)。应用回归分析Wiley系列概率统计

您也可以尝试使用Google进行模型选择的LASSO方法。

答案 2 :(得分:0)

你要求的东西基本上是regression analysis的整体。

这就是线性回归的作用,这是“机器学习”所做的一个很好的部分(机器学习基本上只是更复杂的回归和分类算法的名称)。有数百或数千种不同的方法有各种权衡,但基本的方法经常运作良好。

如果您想了解更多信息,有关机器学习的课程course是一个了解这一点的好地方。