我有一个带有行的DateIndex的Pandas DataFrame。我想定义一些逻辑来创建一个新列,该列将向前看符合某些条件的下一行,然后计算该将来行与当前行之间的列的差值。
例如。使用以下DataFrame:
df = pd.DataFrame({'measurement': [101, 322, 313, 454, 511, 234, 122, 134, 222, 321, 221, 432],
'action': [0, 0, 1, 0, 0, -1, 0, 1, 0, 0, 0, -1]})
我想在每一列中添加一行,例如distance_to_action
,该行由当前measurement
值与未来measurement
值之间的差组成,其中{{ 1}}不等于0。
这可能吗?
谢谢!
答案 0 :(得分:1)
使用pd.merge_asof
将最接近的将来度量值带到新列,然后进行减法。
import pandas as pd
df = pd.merge_asof(df,
df.loc[df.action != 0, ['measurement']],
left_index=True,
right_index=True,
direction='forward',
allow_exact_matches=False, # True if you want same row matches
suffixes=['', '_future'])
df['distance_to_action'] = df.measurement - df.measurement_future
输出:
measurement action measurement_future distance_to_action
0 101 0 313.0 -212.0
1 322 0 313.0 9.0
2 313 1 234.0 79.0
3 454 0 234.0 220.0
4 511 0 234.0 277.0
5 234 -1 134.0 100.0
6 122 0 134.0 -12.0
7 134 1 432.0 -298.0
8 222 0 432.0 -210.0
9 321 0 432.0 -111.0
10 221 0 432.0 -211.0
11 432 -1 NaN NaN