我有一个像这样的CSV文件:
2011 1 10 1000000
2011 1 11 998785
2011 1 12 1002940
2011 1 13 1004815
2011 1 14 1009415
2011 1 18 1011935
我希望将其读入DataFrame对象,并使用frist 3 colomns构建日期时间类型索引。最终的DataFrame应如下所示:
values
datetime(2011,1,10) 1000000
datetime(2011,1,11) 998785
...
我该怎么做?非常感谢!
答案 0 :(得分:3)
import io
import pandas as pd
content = io.BytesIO('''\
2011 1 10 1000000
2011 1 11 998785
2011 1 12 1002940
2011 1 13 1004815
2011 1 14 1009415
2011 1 18 1011935''')
df = pd.read_table(content, sep='\s+', parse_dates=[[0,1,2]], header=None)
df.columns=['date', 'values']
print(df)
产量
date values
0 2011-01-10 00:00:00 1000000
1 2011-01-11 00:00:00 998785
2 2011-01-12 00:00:00 1002940
3 2011-01-13 00:00:00 1004815
4 2011-01-14 00:00:00 1009415
5 2011-01-18 00:00:00 1011935