重新采样跨越数年的熊猫DataFrame

时间:2019-01-09 11:07:18

标签: python pandas

我有一个看起来像这样的系列:

df.index[0:10]

DatetimeIndex(['1881-12-01', '1882-01-01', '1882-02-01', '1882-12-01',
           '1883-01-01', '1883-02-01', '1883-12-01', '1884-01-01',
           '1884-02-01', '1884-12-01'],
          dtype='datetime64[ns]', name='date', freq=None)

现在,我想对其进行重新采样,以便将每年的12月,1月和2月归为一组。更笼统地说:我想对数据框进行重新采样以包含年度周期,而忽略NaN,以便将第一个索引考虑在内:

assert(df[0:3].mean() == df.resample(something).mean().iloc[0])

df.resample('Y')将第一个索引视为单独的年份。我怎么做?我写了一个partition函数,将一个互操作变量分为相等大小的块,但是我觉得我缺少一种惯用的(可能更快)的方式。

1 个答案:

答案 0 :(得分:0)

我可以通过使用here中所述的固定年度偏移量来解决此问题。