如何使用pandas groupby并一起转移

时间:2016-11-20 21:14:09

标签: python pandas group-by apply

我确定我需要使用某种应用功能,但我正努力创造一种能够实现这一目标的功能。我有一个带有股票代码和月度回报的数据框。我需要计算前3个月的回报。它的结构是这样的,每个月,将有500个(使该数字增加)行与所有股票和该月的回报。我一直在尝试这样的事情,但它不起作用。

mr['Quarterly_Returns'] = mr.groupby('ticker')['monthly_returns'].apply(mr['monthly_returns']+mr['monthly_returns'].shift(-1)+mr['monthly_returns'].shift(-2)) 

和建议?

2 个答案:

答案 0 :(得分:0)

您需要lambda xapply代替列名称使用x,因为仅适用于列monthly_returns

mr['Quarterly_Returns'] = mr.groupby('ticker')['monthly_returns']
                            .apply(lambda x: x+x.shift(-1)+x.shift(-2))

答案 1 :(得分:0)

您也可以考虑使用rolling函数。

mr.groupby('ticker')['monthly_returns'].rolling(3).sum()

更完整的例子:

df=pd.concat([pd.DataFrame(index=pd.date_range('1/1/2016','12/31/2016',freq='M'),data={'ticker':x,'return':np.random.rand(12)}) for x in list('ABCD')])
df.groupby('ticker')['return'].rolling(3).sum().unstack('ticker')

ticker  A   B   C   D
2016-01-31  NaN     NaN     NaN     NaN
2016-02-29  NaN     NaN     NaN     NaN
2016-03-31  2.062552    1.508062    1.317836    1.051874
2016-04-30  1.727587    1.856383    1.308263    1.113360
2016-05-31  1.602858    2.112790    1.533763    1.039221
2016-06-30  1.716985    2.403718    1.850741    1.726469
2016-07-31  1.828597    1.809054    1.543079    1.569896
2016-08-31  2.003484    1.531877    1.376907    1.852235
2016-09-30  1.854642    1.319289    1.438446    0.946304
2016-10-31  1.308001    1.718987    1.764252    1.157938
2016-11-30  0.962660    2.255580    1.489076    0.493370
2016-12-31  0.949810    1.753511    1.321650    1.377429