如何使用每天在熊猫中移动的固定参考进行计算?

时间:2016-03-15 18:04:41

标签: python pandas time-series dataframe

我的数据是盘中股票价格数据,多天。这是一个简化版本:

                     Last                                                   
2015-01-02 08:30:00  2035.00
2015-01-02 10:30:00  2038.25                    
2015-01-02 15:15:00  2025.25  
2015-01-05 08:30:00  2020.25  
2015-01-05 10:30:00  2010.75                      
2015-01-05 15:15:00  2015.00                  
2015-01-06 08:30:00  1988.00 
2015-01-06 10:30:00  1990.25                     
2015-01-06 15:15:00  1970.00

鉴于在数据中,每天,最后一行是在15:15:00,我怎样才能获得每天每行的差异(15:15:00行 - 最后一行)。这是所需的输出。

                     Last      Dif                                             
2015-01-02 08:30:00  2035.25  -10 
2015-01-02 10:30:00  2038.25  -13                  
2015-01-02 15:15:00  2025.25   0
2015-01-05 08:30:00  2020.25  -5.25
2015-01-05 10:30:00  2010.00   5                   
2015-01-05 15:15:00  2015.00   0               
2015-01-06 08:30:00  1988.00  -18
2015-01-06 10:30:00  1990.25  -20.25                    
2015-01-06 15:15:00  1970.00   0

1 个答案:

答案 0 :(得分:1)

您可以groupby使用DatetimeIndex.dayapply的最后一个值与实际行值之间的iloc差异:

print df
                        Last
2015-01-02 08:30:00  2035.25
2015-01-02 10:30:00  2038.25
2015-01-02 15:15:00  2025.25
2015-01-05 08:30:00  2020.25
2015-01-05 10:30:00  2010.00
2015-01-05 15:15:00  2015.00
2015-01-06 08:30:00  1988.00
2015-01-06 10:30:00  1990.25
2015-01-06 15:15:00  1970.00

df['Dif'] = df.groupby(df.index.day)['Last'].apply(lambda x: x.iloc[-1] - x)
print df
                        Last    Dif
2015-01-02 08:30:00  2035.25 -10.00
2015-01-02 10:30:00  2038.25 -13.00
2015-01-02 15:15:00  2025.25   0.00
2015-01-05 08:30:00  2020.25  -5.25
2015-01-05 10:30:00  2010.00   5.00
2015-01-05 15:15:00  2015.00   0.00
2015-01-06 08:30:00  1988.00 -18.00
2015-01-06 10:30:00  1990.25 -20.25
2015-01-06 15:15:00  1970.00   0.00