python pandas组合返回

时间:2018-01-25 20:51:43

标签: python pandas finance

我有一个包含市场数据的数据框和一个专门用于每日回报的专栏。 我很难创建一个价值100,000美元的投资组合,并计算其在数据系列生命周期内的累积回报。

理想情况下,我想使用熊猫计算“投资组合”列,但我遇到了麻烦。见下面的目标输出。谢谢。

index    date      index  return  portfolio
0        19900101  2000   Nan     100000.00
1        19900102  2002   0.001   100100.00
2        19900103  2020   0.00899 100999.90 
3        19900104  2001  -0.00941 100049.49

2 个答案:

答案 0 :(得分:3)

使用cumprod

df['P']=df['return'].add(1).fillna(1).cumprod()*100000
df
Out[843]: 
   index      date  index.1   return  portfolio             P
0      0  19900101     2000      NaN  100000.00  100000.00000
1      1  19900102     2002  0.00100  100100.00  100100.00000
2      2  19900103     2020  0.00899  100999.90  100999.89900
3      3  19900104     2001 -0.00941  100049.49  100049.48995

一些调整:

df=df.replace('Nan',np.nan)
df['return']=pd.to_numeric(df['return'])

答案 1 :(得分:2)

starting_value = 100000
df = df.assign(portfolio=(1 + df['return'].fillna(0)).cumprod().mul(starting_value))
>>> df
   index      date  index.1   return     portfolio
0      0  19900101     2000      NaN  100000.00000
1      1  19900102     2002  0.00100  100100.00000
2      2  19900103     2020  0.00899  100999.89900
3      3  19900104     2001 -0.00941  100049.48995

为了可视化正在发生的事情,cumprod正在计算复合回报,例如cum_r3 = (1 + r1) * (1 + r2) * (1 + r3)

>>> (1 + df['return'].fillna(0)).cumprod()
0    1.000000
1    1.001000
2    1.009999
3    1.000495
Name: return, dtype: float64