我正在尝试以每月一次的频率使用重采样功能,该频率从每个月的同一天('MS')开始,但是我无法使其正常工作。
我有一个数据框:
aux.head()
Out[27]:
IDENTIFICADOR FECHA Inyectividad Arena
FECHA
2011-07-29 CoHS-1022 2011-07-29 0.0 0.01
2011-07-30 CoHS-1022 2011-07-30 0.0 0.02
2011-07-31 CoHS-1022 2011-07-31 0.0 0.05
2011-01-08 CoHS-1022 2011-01-08 0.0 0.02
2011-02-08 CoHS-1022 2011-02-08 0.0 0.01
如果我使用每月频率“ M”:
mensual['Arena'] = aux['Arena'].resample('M').mean()
我得到:
mensual.head()
Out[29]:
Arena
FECHA
2011-01-31 0.112
2011-02-28 0.108
2011-03-31 0.122
2011-04-30 0.110
2011-05-31 0.100
但是我希望所有月份都从同一天开始, 喜欢:
Arena
FECHA
2011-01-1 some mean value
2011-02-1 some mean value
2011-03-1 some mean value
2011-04-1 some mean value
2011-05-1 some mean value
所以我尝试了:
mensual['Arena'] = aux['Arena'].resample('MS').mean()
但是我得到了
mensual.head()
Out[32]:
Arena
FECHA
2011-01-31 NaN
2011-02-28 NaN
2011-03-31 NaN
2011-04-30 NaN
2011-05-31 NaN
答案 0 :(得分:1)
您可以使用pd.offsets.MonthBegin
s = df['Arena'].resample('M').mean()
s.index = s.index - pd.offsets.MonthBegin(1)