我有一个包含市场数据的数据框和一个专门用于每日回报的专栏。 我很难创建一个价值100,000美元的投资组合,并计算其在数据系列生命周期内的累积回报。
理想情况下,我想使用熊猫计算“投资组合”列,但我遇到了麻烦。见下面的目标输出。谢谢。
index date index return portfolio
0 19900101 2000 Nan 100000.00
1 19900102 2002 0.001 100100.00
2 19900103 2020 0.00899 100999.90
3 19900104 2001 -0.00941 100049.49
答案 0 :(得分:3)
使用cumprod
df['P']=df['return'].add(1).fillna(1).cumprod()*100000
df
Out[843]:
index date index.1 return portfolio P
0 0 19900101 2000 NaN 100000.00 100000.00000
1 1 19900102 2002 0.00100 100100.00 100100.00000
2 2 19900103 2020 0.00899 100999.90 100999.89900
3 3 19900104 2001 -0.00941 100049.49 100049.48995
一些调整:
df=df.replace('Nan',np.nan)
df['return']=pd.to_numeric(df['return'])
答案 1 :(得分:2)
starting_value = 100000
df = df.assign(portfolio=(1 + df['return'].fillna(0)).cumprod().mul(starting_value))
>>> df
index date index.1 return portfolio
0 0 19900101 2000 NaN 100000.00000
1 1 19900102 2002 0.00100 100100.00000
2 2 19900103 2020 0.00899 100999.89900
3 3 19900104 2001 -0.00941 100049.48995
为了可视化正在发生的事情,cumprod
正在计算复合回报,例如cum_r3 = (1 + r1) * (1 + r2) * (1 + r3)
。
>>> (1 + df['return'].fillna(0)).cumprod()
0 1.000000
1 1.001000
2 1.009999
3 1.000495
Name: return, dtype: float64