我需要在一个窗口上执行累积返回计算,该窗口的函数会在下一个窗口的开头重新启动。我们来看一个例子:
A = pd.DataFrame([100, 101, 102, 103, 104, 105, 106, 107, 108],
columns=['A'], index=[range(1,10)])
假设您将窗口大小定义为3,假设我需要窗口的累积回报,则所需的输出将是
A['B'] = function(A['A'], window=3)
A B
1 100 0
2 101 0.010000
3 102 0.020000
4 103 0
5 104 0.009709
6 105 0.019417
7 106 0
8 107 0.009434
9 108 0.018868
感谢。
答案 0 :(得分:1)
IIUC,您可以使用groupby
:
>>> w = 3
>>> A["B"] = A.groupby(np.arange(len(A))//w)["A"].apply(lambda x: x/x.iloc[0]-1)
>>> A
A B
1 100 0.000000
2 101 0.010000
3 102 0.020000
4 103 0.000000
5 104 0.009709
6 105 0.019417
7 106 0.000000
8 107 0.009434
9 108 0.018868