我有一个示例,其中我需要根据if-else条件填充数据框列,该条件引用当前行以及上一行。这是示例数据集:
time = pd.Series(pd.date_range(start='20140101', end='20190901', freq='Q').astype('period[Q]'), name='time')
results = pd.Series(['0','W','W','W','0','0','L','L','L','L','W','W','W','0','0','W','W','W','0','L','L','0'], name='result')
df = pd.concat([time, results], axis=1)
我想创建一列df['last win']
,如果该列是time
或最后一个W
,则该列包含当前行的time
值W
。因此,所需的输出将是:
time result last_win
0 2014Q1 0 NaT
1 2014Q2 W 2014Q2
2 2014Q3 W 2014Q3
3 2014Q4 W 2014Q4
4 2015Q1 0 2014Q4
5 2015Q2 0 2014Q4
6 2015Q3 L 2014Q4
7 2015Q4 L 2014Q4
8 2016Q1 L 2014Q4
9 2016Q2 L 2014Q4
10 2016Q3 W 2016Q3
11 2016Q4 W 2016Q4
12 2017Q1 W 2017Q1
13 2017Q2 0 2017Q1
14 2017Q3 0 2017Q1
15 2017Q4 W 2017Q4
16 2018Q1 W 2018Q1
17 2018Q2 W 2018Q2
18 2018Q3 0 2018Q2
19 2018Q4 L 2018Q2
20 2019Q1 L 2018Q2
21 2019Q2 0 2018Q2
我不确定如何以有条件的方式使用.apply
或.shift
功能。
答案 0 :(得分:5)
使用where
,然后使用fillna
并指定前向填充来填补损失和平局:
df['last_win'] = np.where(df['result'] == 'W', df['time'], np.NaN)
df.fillna(method="ffill", inplace=True)
答案 1 :(得分:4)
df['last win'] = df.loc[df.result=='W','time']
df['last win'] = df['last win'].ffill()