在我的dataframe
中,时间分为3列:year
,month
,day
,如下所示:
如何将它们转换为date
,以便进行时间序列分析?
我可以这样做:
df.apply(lambda x:'%s %s %s' % (x['year'],x['month'], x['day']),axis=1)
给出:
1095 1954 1 1
1096 1954 1 2
1097 1954 1 3
1098 1954 1 4
1099 1954 1 5
1100 1954 1 6
1101 1954 1 7
1102 1954 1 8
1103 1954 1 9
1104 1954 1 10
1105 1954 1 11
1106 1954 1 12
1107 1954 1 13
但接下来呢?
修改 这就是我最终的结果:
from datetime import datetime
df['date']= df.apply(lambda x:datetime.strptime("{0} {1} {2}".format(x['year'],x['month'], x['day']), "%Y %m %d"),axis=1)
df.index= df['date']
答案 0 :(得分:8)
以下是如何将值转换为时间:
import datetime
df.apply(lambda x:datetime.strptime("{0} {1} {2} 00:00:00".format(x['year'],x['month'], x['day']), "%Y %m %d %H:%M:%S"),axis=1)
答案 1 :(得分:2)
将日期格式化为字符串并立即重新解析是没有意义的;使用datetime
构造函数:
df.apply(lambda x: datetime.date(x['year'], x['month'], x['day']), axis=1)