用于时间序列数据预测的线性回归模型选择

时间:2018-11-16 05:25:54

标签: python linear-regression

我有一个信号,想使用回归模型预测y表示的请求数。目前,我正在使用OLS回归模型来预测y。但是预测误差很高,因为我的信号有很多变化(上下波动),如下所示。

我注意到我的模型在大多数时候都高估了y(请求数),尤其是在要预测的点之前带有较大y值的情况下。如下黄色和红色圆圈所示。

enter image description here

因此,我不确定是否有健壮的回归模型来解决这个问题,即我的数据集中会有很多变化。还可以通过调整窗口大小以使其不包括这些值来分割出这些大值吗?

能否请您告知

1 个答案:

答案 0 :(得分:0)

从错误的可视化角度来看,我认为线性模型不合适,您应该考虑使用处理周期数据和移动平均线的东西-您的数据似乎包含周期元素,而移动平均线元素超出了一些“线性”的东西。考虑类似ARIMA之类的东西。这是ARIMA教程的链接:https://machinelearningmastery.com/arima-for-time-series-forecasting-with-python/请发布结果:)

Vishaal