如何在Pandas / Numpy中同时实现具有非重叠和滚动功能的功能?

时间:2014-09-16 23:03:47

标签: python numpy pandas dataframe

我需要在一个窗口上执行累积返回计算,该窗口的函数会在下一个窗口的开头重新启动。我们来看一个例子:

A = pd.DataFrame([100, 101, 102, 103, 104, 105, 106, 107, 108],
                 columns=['A'], index=[range(1,10)])

假设您将窗口大小定义为3,假设我需要窗口的累积回报,则所需的输出将是

A['B'] = function(A['A'], window=3)

      A         B
1   100         0
2   101  0.010000
3   102  0.020000
4   103         0
5   104  0.009709
6   105  0.019417
7   106         0
8   107  0.009434
9   108  0.018868

感谢。

1 个答案:

答案 0 :(得分:1)

IIUC,您可以使用groupby

执行此操作
>>> w = 3
>>> A["B"] = A.groupby(np.arange(len(A))//w)["A"].apply(lambda x: x/x.iloc[0]-1)
>>> A
     A         B
1  100  0.000000
2  101  0.010000
3  102  0.020000
4  103  0.000000
5  104  0.009709
6  105  0.019417
7  106  0.000000
8  107  0.009434
9  108  0.018868