我有以下数据框:
import numpy as np
import pandas as pd
dates = pd.date_range(start='2014-01-01',end='2018-01-01', freq='Y')
df = pd.DataFrame(5*np.eye(4,), index=dates, columns=['Var1', 'Var2', 'Var3', 'Var4'])
print(df)
Var1 Var2 Var3 Var4
2014-12-31 5.0 0.0 0.0 0.0
2015-12-31 0.0 5.0 0.0 0.0
2016-12-31 0.0 0.0 5.0 0.0
2017-12-31 0.0 0.0 0.0 5.0
我想计算3年中2014年和2015年每个变量的NPV值。
现在我知道如何同时获取一个变量和一行的当前值:
Var1_2014 = df.loc['2014':'2016','Var1'].tolist()
NPV_Var1_2014 = np.npv(0.7,[0]+Var1_2014)
但是,我不知道如何对函数进行向量化以直接计算整个列。我想获得类似的东西:
Var1 Var2 Var3 Var4 Var1_NPV
2014-12-31 5.0 0.0 0.0 0.0 a
2015-12-31 0.0 5.0 0.0 0.0 b
2016-12-31 0.0 0.0 5.0 0.0 Nan
2017-12-31 0.0 0.0 0.0 5.0 Nan
在这里我可以说类似df['Var1_NPV']= npv('Var1',duration=3years,discount_rate=0.7)
关于如何有效地矢量化该功能的任何想法吗?
非常感谢,
答案 0 :(得分:0)
我找到了一个带有apply和offset的解决方案:
def give_npv(date,df,var,wacc):
date2 = date + pd.DateOffset(years=2)
data = df.loc[date:date2,var].tolist()
NPV_var = np.npv(wacc,[0]+data)
return NPV_var
df['index2'] = df.index
df['test'] = df.apply(lambda x: give_npv(x['index2'],df,'Var2',0.07) ,axis=1 )
print(df)
Var1 Var2 Var3 Var4 index2 test
2014-12-31 5.0 0.0 0.0 0.0 2014-12-31 4.367194
2015-12-31 0.0 5.0 0.0 0.0 2015-12-31 4.672897
2016-12-31 0.0 0.0 5.0 0.0 2016-12-31 0.000000
2017-12-31 0.0 0.0 0.0 5.0 2017-12-31 0.000000