如何根据Python中的一些标准训练几种不同的回归模型

时间:2017-08-11 18:59:06

标签: python machine-learning scikit-learn

我绘制了我的数据的滚动相关图,并发现我的一些因变量和目标变量的相关性在很短的时间内从高度正面变为负面,然后恢复正常。我想要做的是从我的线性回归模型中删除这个特定时间段的变量,并在它们的相关性恢复正常时将它们添加回来。

所以我认为这等于训练几种不同的模型并在之后将它们组合起来。 有谁知道如何实现这一目标?

1 个答案:

答案 0 :(得分:0)

您需要做的是清理数据,而不是为每种不同的行为创建模型。

这是一个关于数据预处理的完整sklearn教程,您可能会觉得有用:

因此,您案例中的整个流程将是:

  1. 异常值检测:检测具有异常行为的数据部分
  2. 数据插补:您可以将异常时段中的变量值替换为异常时段之外的每个变量值的平均值。
  3. 培训:在清理过的数据上训练您的模型。