我的数据框如下所示:
Date Value
1 01/04/2012 26200
2 02/04/2012 81100
3 03/04/2012 89800
4 04/04/2012 116800
5 05/04/2012 111300
6 06/04/2012 142200
(以上数据只是整个数据集的head())
我有500个日期的值,我想预测接下来20个日期的值。我该怎么做呢?
我认为我会在第2列应用线性回归,然后应用predict()将第0列的下20个值(即501,502,503,...,520)保持为X,但我认为这样做不准确。我是R的新手,我听说有一个时间序列分析和预测包。使用这些软件包的解决方案也可能有所帮助。
答案 0 :(得分:0)
我认为我会在第2列应用线性回归,然后应用predict()将第0列的下20个值(即501,502,503,...,520)保持为X,但我认为这样做不准确。
你是对的,这种方法不合适,因为线性回归不能考虑你时间序列的自相关结构。
除了预测包之外,您还可以尝试TSA package,但您可能需要对时间序列分析基础知识(例如自相关,arma,arima模型)有所了解,以便进行有意义的分析和预测