如何在python

时间:2017-08-26 21:33:07

标签: python regression

我想问一下多参数线性回归模型。 问题如下: 我们现在有100家公司的数据,对于每家公司,我有3个季节的参数A,B,C,D的数据。(我们可以称之为A1,A2,A3,B1,B2,B3 ..等) 我们假设在A和BCD之间存在一些关系(我们还不知道,并且需要找到),现在我们需要为第4季预测A,这是A4 ...

我的方法是使用普通最小二乘公式计算关系,得到A4 = x1 * B4 + x2 * C4 + x3 * D4形式的最终公式。 我通过简单地对B,C,D进行线性回归得到B4,C4,D4 但问题是我用这种方式得到的A4比A ...的线性回归更糟糕。

有人可以告诉我一个更好的解决方案吗? 感谢

1 个答案:

答案 0 :(得分:0)

我也是数据分析和建模的新手。 如果我遇到这类问题,我可能会考虑一些问题:

  • 真的 是否存在独立变量和因变量之间的显着线性或广义线性关系?我应该在回归之前预先处理或转移它们吗?
  • 是否有必要涉及预测变量之间的相互作用?
  • 用于训练模型的数据集的质量如何?它是否足以满足因素响应之间真正的潜在关系?
  • 我应该选择更合适的方法来创建预测模型吗?例如,我们通常选择偏最小二乘回归(PLS),而不是普通最小二乘回归(OLS),来解决我工作区域的多重共线性。

    希望这些对您有所帮助。