我有一个pandas数据框,其中一列包含年份和季度的字符串,格式如下:
2015Q1
我的问题: 如何将其转换为两个日期时间列,一个用于年份,另一个用于本季度。
答案 0 :(得分:7)
您可以使用split
,然后将year
列投放到int
,并在必要时将Q
添加到列q
:
df = pd.DataFrame({'date':['2015Q1','2015Q2']})
print (df)
date
0 2015Q1
1 2015Q2
df[['year','q']] = df.date.str.split('Q', expand=True)
df.year = df.year.astype(int)
df.q = 'Q' + df.q
print (df)
date year q
0 2015Q1 2015 Q1
1 2015Q2 2015 Q2
您也可以使用Period
:
df['date'] = pd.to_datetime(df.date).dt.to_period('Q')
df['year'] = df['date'].dt.year
df['quarter'] = df['date'].dt.quarter
print (df)
date year quarter
0 2015Q1 2015 1
1 2015Q2 2015 2
答案 1 :(得分:3)
您还可以构建一个datetimeIndex并在其上调用year和quarter。
df.index = pd.to_datetime(df.date)
df['year'] = df.index.year
df['quarter'] = df.index.quarter
date year quarter
date
2015-01-01 2015Q1 2015 1
2015-04-01 2015Q2 2015 2
请注意,如果你有datetimeIndex,你甚至不需要年份和季度的专用列,你可以这样做一个像这样的组:df.groupby(df.index.quarter)