我收集了一份数据集here。首先,我想整理这个数据集,因为当我使用read_csv
中的pandas
时,它会显示一列(而不是10)中的所有数据。输出为[8784 rows x 1 columns]
这是错误的(如何解决此问题?)
其次,我想在这个数据集上检查一个简单的ARMA模型,只是为了预测AC
列的值(仅供我自己熟悉这个模型和数据分析)你能不能请帮我一些提示?如何/从哪里开始?该怎么办?
有关数据集的更多信息:让我们说这个数据集的第一行显示(例如)当01-01-2016
为12时({1}} 00:00
outside_tem
x = 20)且humidity
为10(小于20),AC
的值为关闭。在01-01-2017 12:00的类似/不同条件(湿度,out_temp,灯等)中,AC的价值是多少?
答案 0 :(得分:1)
使用pd.read_fwf()方法:
In [253]: df = pd.read_fwf(r'D:\download\comfort.csv')
In [254]: df
Out[254]:
date time humidity Outside_Temperature window light age skintemp SR AC
0 01-01-2016 00:00 10 12 0 1 40 45 0 0
1 01-01-2016 01:00 10 11 0 1 40 32 0 0
2 01-01-2016 02:00 10 15 0 1 32 40 0 0
3 01-01-2016 03:00 10 11 0 1 15 37 0 0
4 01-01-2016 04:00 10 11 0 1 40 33 0 0
5 01-01-2016 05:00 10 13 0 1 15 37 0 0
6 01-01-2016 06:00 10 11 0 1 32 42 0 0
7 01-01-2016 07:00 10 16 0 1 15 41 0 0
8 01-01-2016 08:00 20 25 1 2 15 36 1 0
9 01-01-2016 09:00 20 10 1 2 32 37 1 0
... ... ... ... ... ... ... ... ... .. ..
8774 31-12-2016 14:00 20 12 1 2 15 33 0 0
8775 31-12-2016 15:00 20 9 1 2 15 29 0 0
8776 31-12-2016 16:00 30 8 1 3 40 38 0 1
8777 31-12-2016 17:00 30 9 1 3 32 43 0 1
8778 31-12-2016 18:00 30 12 1 3 40 30 0 1
8779 31-12-2016 19:00 30 3 1 3 32 28 0 1
8780 31-12-2016 20:00 10 11 0 1 40 41 0 0
8781 31-12-2016 21:00 10 12 0 1 32 26 0 0
8782 31-12-2016 22:00 10 6 0 1 40 30 0 0
8783 31-12-2016 23:00 10 8 0 1 32 35 0 0
[8784 rows x 10 columns]