我是python pandas的新手,并且一直试图使用pct_change()来获得回报率。我想通过feedcode获得每月变化率。 这是我目前的代码:
In [134]:
df3 = pd.read_csv(r'C:\Users\sector_set.csv')
df3.set_index('Date', inplace= True)
df3= pd.DataFrame(df3,columns = ['Feed','Close']) # filter specific col
grouped = df3.groupby('Feed') #group by Feedcode
df3 = grouped.resample('BM', how=lambda x:x[-1]) #ending of every month only
df3['Rate_Return'] = df3.pct_change() # Rate of Return of each feedcode
df3
OUTPUT:
Close Rate_Return
Feed Date
A 2015-09-30 5.60 NaN
2015-10-30 5.75 0.026786
AAV 2015-09-30 4.32 -0.248696
2015-10-30 4.62 0.069444
我有两个问题:
计算的回报率不正确,因为它参考前一天的Feedcode价格来计算下一个Feed代码的回报。例如,Feed AAV 2015-09-30应该是NaN而不是-0.248696
我想删除所有NaN
我正在尝试计算返回值以获得类似的结果:
Output:
Close Rate_Return
Feed Date
A 2015-10-30 5.75 0.026786
AAV 2015-10-30 4.32 0.069444
这样做的最佳方式是什么? 在此先感谢您的任何帮助
答案 0 :(得分:2)
IIUC您需要从Feed
通过multiindex进行分组并应用pct_change
。然后,您可以使用df3
的子集,其中列Rate_Return
为notnull
df3['Rate_Return'] = df3.groupby(level=0).pct_change()
print df3
Close Rate_Return
Feed Date
A 2015-09-30 5.60 NaN
2015-10-30 5.75 0.026786
AAV 2015-09-30 4.32 NaN
2015-10-30 4.62 0.069444
print df3[df3.Rate_Return.notnull()]
Close Rate_Return
Feed Date
A 2015-10-30 5.75 0.026786
AAV 2015-10-30 4.62 0.069444