使用重新取样作业,我将月度值转换为季度值:
hs=hs.resample('QS',axis=1).mean()
效果很好,我的专栏看起来像这样:
hs.columns:
DatetimeIndex(['2000-01-01', '2000-04-01', '2000-07-01', '2000-10-01',
'2001-01-01', '2001-04-01', '2001-07-01', '2001-10-01',
'2002-01-01', '2002-04-01', '2002-07-01', '2002-10-01',
现在我希望它们以YYYYq [1-4]格式进行转换,我认为应该这样简单(根据此Link):
hs.columns.strftime('%Yq%q')
但是这给了:
array(['2000qq', '2000qq', '2000qq', '2000qq', '2001qq', '2001qq',
'2001qq', '2001qq', '2002qq', '2002qq', '2002qq', '2002qq',
'2003qq', '2003qq', '2003qq', '2003qq', '2004qq', '2004qq',
我哪里出错了,我该如何解决这个问题?
答案 0 :(得分:2)
使用pd.Series.dt.to_period
的一种方式:
df = pd.DataFrame(columns=['2000-01-01', '2000-04-01', '2000-07-01', '2000-10-01',
'2001-01-01', '2001-04-01', '2001-07-01', '2001-10-01',
'2002-01-01', '2002-04-01', '2002-07-01', '2002-10-01'])
df.columns = pd.to_datetime(df.columns.to_series()).dt.to_period('Q')
print(df.columns)
# PeriodIndex(['2000Q1', '2000Q2', '2000Q3', '2000Q4', '2001Q1', '2001Q2',
# '2001Q3', '2001Q4', '2002Q1', '2002Q2', '2002Q3', '2002Q4'],
# dtype='period[Q-DEC]', freq='Q-DEC')
答案 1 :(得分:1)
文档指定期间数据类型上的strftime
而非日期时间数据类型;要使用%q
格式化程序,您可以将日期时间索引转换为句点(以天为单位),然后对其进行格式化:
cols = pd.DatetimeIndex(['2000-01-01', '2000-04-01', '2000-07-01', '2000-10-01',
'2001-01-01', '2001-04-01', '2001-07-01', '2001-10-01',
'2002-01-01', '2002-04-01', '2002-07-01', '2002-10-01'])
cols.to_period('D').strftime('%Yq%q')
# hs.columns.to_period('D').strftime('%Yq%q')
#array([u'2000q1', u'2000q2', u'2000q3', u'2000q4', u'2001q1', u'2001q2',
# u'2001q3', u'2001q4', u'2002q1', u'2002q2', u'2002q3', u'2002q4'],
# dtype='<U6')
或者只使用to_period
Q
(季度)作为单位:
cols.to_period('Q')
# hs.columns.to_period('Q')
#PeriodIndex(['2000Q1', '2000Q2', '2000Q3', '2000Q4', '2001Q1', '2001Q2',
# '2001Q3', '2001Q4', '2002Q1', '2002Q2', '2002Q3', '2002Q4'],
# dtype='period[Q-DEC]', freq='Q-DEC')