我有一个名为df的pandas DataFrame,其中包含以下数据:
Index SourceDate
0 AUG_2013
1 SEP_2013
2 JAN_2012
我需要添加一个额外的列,将每个日期转换为以下ConvertedDate列。此列的日期为YYYY-MM-DD格式,日期始终为01。
Index SourceDate ConvertedDate
0 AUG_2013 2013-08-01
1 SEP_2013 2013-09-01
2 JAN_2012 2012-01-01
我试图这样做:
df['ConvertedDate'] = time.strptime(str.replace(str.rsplit(df.SourceDate,'_',1)[0],'_','-01-'),'%b-%d-%Y')
不幸的是,这不起作用,因为df.SourceDate是一个系列,并且字符串函数不能在系列上工作。
答案 0 :(得分:2)
使用to_datetime
并传递格式字符串:
In [64]:
df['ConvertedDate'] =pd.to_datetime(df['SourceDate'], format='%b_%Y')
df
Out[64]:
Index SourceDate ConvertedDate
0 0 AUG_2013 2013-08-01
1 1 SEP_2013 2013-09-01
2 2 JAN_2012 2012-01-01
可以找到python datetime格式字符串说明符here