计算pandas DataFrame列的当前行和将来行匹配条件之间的值

时间:2018-10-29 16:51:19

标签: pandas

我有一个带有行的DateIndex的Pandas DataFrame。我想定义一些逻辑来创建一个新列,该列将向前看符合某些条件的下一行,然后计算该将来行与当前行之间的列的差值。

例如。使用以下DataFrame:

df = pd.DataFrame({'measurement': [101, 322, 313, 454, 511, 234, 122, 134, 222, 321, 221, 432],
                    'action': [0, 0, 1, 0, 0, -1, 0, 1, 0, 0, 0, -1]})

我想在每一列中添加一行,例如distance_to_action,该行由当前measurement值与未来measurement值之间的差组成,其中{{ 1}}不等于0。

这可能吗?

谢谢!

1 个答案:

答案 0 :(得分:1)

使用pd.merge_asof将最接近的将来度量值带到新列,然后进行减法。

import pandas as pd

df = pd.merge_asof(df, 
                   df.loc[df.action != 0, ['measurement']], 
                   left_index=True, 
                   right_index=True, 
                   direction='forward',
                   allow_exact_matches=False,  # True if you want same row matches
                   suffixes=['', '_future'])

df['distance_to_action'] = df.measurement - df.measurement_future

输出:

    measurement  action  measurement_future  distance_to_action
0           101       0               313.0              -212.0
1           322       0               313.0                 9.0
2           313       1               234.0                79.0
3           454       0               234.0               220.0
4           511       0               234.0               277.0
5           234      -1               134.0               100.0
6           122       0               134.0               -12.0
7           134       1               432.0              -298.0
8           222       0               432.0              -210.0
9           321       0               432.0              -111.0
10          221       0               432.0              -211.0
11          432      -1                 NaN                 NaN