使用ARMA模型修复Python中的数据集和预测时间序列

时间:2017-05-01 12:06:30

标签: python pandas dataset regression forecasting

我收集了一份数据集here。首先,我想整理这个数据集,因为当我使用read_csv中的pandas时,它会显示一列(而不是10)中的所有数据。输出为[8784 rows x 1 columns]这是错误的(如何解决此问题?)

其次,我想在这个数据集上检查一个简单的ARMA模型,只是为了预测AC列的值(仅供我自己熟悉这个模型和数据分析)你能不能请帮我一些提示?如何/从哪里开始?该怎么办?

有关数据集的更多信息:让我们说这个数据集的第一行显示(例如)当01-01-2016为12时({1}} 00:00 outside_tem x = 20)且humidity为10(小于20),AC的值为关闭。在01-01-2017 12:00的类似/不同条件(湿度,out_temp,灯等)中,AC的价值是多少?

1 个答案:

答案 0 :(得分:1)

使用pd.read_fwf()方法:

In [253]: df = pd.read_fwf(r'D:\download\comfort.csv')

In [254]: df
Out[254]:
            date   time  humidity  Outside_Temperature  window  light  age  skintemp  SR  AC
0     01-01-2016  00:00        10                   12       0      1   40        45   0   0
1     01-01-2016  01:00        10                   11       0      1   40        32   0   0
2     01-01-2016  02:00        10                   15       0      1   32        40   0   0
3     01-01-2016  03:00        10                   11       0      1   15        37   0   0
4     01-01-2016  04:00        10                   11       0      1   40        33   0   0
5     01-01-2016  05:00        10                   13       0      1   15        37   0   0
6     01-01-2016  06:00        10                   11       0      1   32        42   0   0
7     01-01-2016  07:00        10                   16       0      1   15        41   0   0
8     01-01-2016  08:00        20                   25       1      2   15        36   1   0
9     01-01-2016  09:00        20                   10       1      2   32        37   1   0
...          ...    ...       ...                  ...     ...    ...  ...       ...  ..  ..
8774  31-12-2016  14:00        20                   12       1      2   15        33   0   0
8775  31-12-2016  15:00        20                    9       1      2   15        29   0   0
8776  31-12-2016  16:00        30                    8       1      3   40        38   0   1
8777  31-12-2016  17:00        30                    9       1      3   32        43   0   1
8778  31-12-2016  18:00        30                   12       1      3   40        30   0   1
8779  31-12-2016  19:00        30                    3       1      3   32        28   0   1
8780  31-12-2016  20:00        10                   11       0      1   40        41   0   0
8781  31-12-2016  21:00        10                   12       0      1   32        26   0   0
8782  31-12-2016  22:00        10                    6       0      1   40        30   0   0
8783  31-12-2016  23:00        10                    8       0      1   32        35   0   0

[8784 rows x 10 columns]