Pandas:根据DataFrame中的其他列在DataFrame中创建新列

时间:2015-11-09 13:13:33

标签: python pandas

我有一个名为df的pandas DataFrame,其中包含以下数据:

Index    SourceDate
0        AUG_2013
1        SEP_2013
2        JAN_2012

我需要添加一个额外的列,将每个日期转换为以下ConvertedDate列。此列的日期为YYYY-MM-DD格式,日期始终为01。

Index    SourceDate    ConvertedDate
0        AUG_2013      2013-08-01
1        SEP_2013      2013-09-01
2        JAN_2012      2012-01-01

我试图这样做:

df['ConvertedDate'] = time.strptime(str.replace(str.rsplit(df.SourceDate,'_',1)[0],'_','-01-'),'%b-%d-%Y')

不幸的是,这不起作用,因为df.SourceDate是一个系列,并且字符串函数不能在系列上工作。

1 个答案:

答案 0 :(得分:2)

使用to_datetime并传递格式字符串:

In [64]:
df['ConvertedDate'] =pd.to_datetime(df['SourceDate'], format='%b_%Y')
df

Out[64]:
   Index SourceDate ConvertedDate
0      0   AUG_2013    2013-08-01
1      1   SEP_2013    2013-09-01
2      2   JAN_2012    2012-01-01

可以找到python datetime格式字符串说明符here