python在统一的半年期间重新抽样(相当于''在pandas resample中)

时间:2014-08-19 12:25:18

标签: python pandas

在python中有一个'BQ'等效的半年重采样吗?我在这里找不到它

http://pandas.pydata.org/pandas-docs/dev/timeseries.html#up-and-downsampling

我有一组记录,其中一些跟随jun-dec,一些jan-jul,一些feb-auh等。我如何将它们全部重新采样到jun-dec(并发用于jun-dec,并且跟随jun / dec获取其他记录?

谢谢。

1 个答案:

答案 0 :(得分:4)

'2BQ'怎么样?

In [57]: ts = pd.Series(range(1000), index=pd.date_range('2000-4-15', periods=1000))

In [58]: ts.resample('2BQ', how='sum')
Out[58]: 
2000-06-30      2926
2000-12-29     30485
2001-06-29     63609
2001-12-31     98605
2002-06-28    127985
2002-12-31    166935
2003-06-30      8955
Freq: 2BQ-DEC, dtype: int64

2季度偏移将基于系列中的第一个时间戳,因此如果您的数据恰好在1月至3月或6月至9月开始,则锚点将是错误的。修复它的一种方法是在系列的开头填充一个虚拟日期,这样锚就是正确的。

ts = pd.Series(range(1000), index=pd.date_range('2000-3-15', periods=1000))

from datetime import datetime
if ts.index[0].month in [1,2,3]:
    ts.loc[datetime(ts.index[0].year - 1, 12, 1)] = np.nan
elif ts.index[0].month in [7,8,9]:
    ts.loc[datetime(ts.index[0].year, 6, 1)] = np.nan

应该给出正确答案(并且可以删除第一个条目)。

In [85]: ts.resample('2BQ', how='sum')
Out[85]: 
1999-12-31       NaN
2000-06-30      5778
2000-12-29     36127
2001-06-29     69251
2001-12-31    104340
2002-06-28    133534
2002-12-31    150470
Freq: 2BQ-DEC, dtype: float64