我每天要重新采样20年的数据,以便将数据分解为3月-10月和11月-2月。基本上是8个月和4个月的块。有没有办法使用重采样功能做到这一点?
我认为DateOffset'8MS'将每8个月重新采样一次。有没有办法让它交替8个月到4个月?
我实际上并不需要这四个月的数据,因此我可以选择删除这些数据并将其保存在8MS。
答案 0 :(得分:2)
由于您不需要这4个月的数据,最简单的方法是过滤这几个月,然后可以按年使用resample
或groupby
。假设索引为DatetimeIndex
,则可以执行以下操作:
#mask to keep months in [3, 4, ...10]
m = df.index.month.isin(range(3, 11))
#with resample for example
df[m].resample('Y').mean()
#with groupby
df[m].groupby(df.index.year[m]).mean()
类似的结果,但索引名称除外