大熊猫DataFrame中的if-else条件引用了两行

时间:2019-09-07 18:39:56

标签: python pandas dataframe

我有一个示例,其中我需要根据if-else条件填充数据框列,该条件引用当前行以及上一行。这是示例数据集:

time = pd.Series(pd.date_range(start='20140101', end='20190901', freq='Q').astype('period[Q]'), name='time')
results = pd.Series(['0','W','W','W','0','0','L','L','L','L','W','W','W','0','0','W','W','W','0','L','L','0'], name='result')
df = pd.concat([time, results], axis=1)

我想创建一列df['last win'],如果该列是time或最后一个W,则该列包含当前行的timeW。因此,所需的输出将是:

     time result last_win
0  2014Q1      0      NaT
1  2014Q2      W   2014Q2
2  2014Q3      W   2014Q3
3  2014Q4      W   2014Q4
4  2015Q1      0   2014Q4
5  2015Q2      0   2014Q4
6  2015Q3      L   2014Q4
7  2015Q4      L   2014Q4
8  2016Q1      L   2014Q4
9  2016Q2      L   2014Q4
10 2016Q3      W   2016Q3
11 2016Q4      W   2016Q4
12 2017Q1      W   2017Q1
13 2017Q2      0   2017Q1
14 2017Q3      0   2017Q1
15 2017Q4      W   2017Q4
16 2018Q1      W   2018Q1
17 2018Q2      W   2018Q2
18 2018Q3      0   2018Q2
19 2018Q4      L   2018Q2
20 2019Q1      L   2018Q2
21 2019Q2      0   2018Q2

我不确定如何以有条件的方式使用.apply.shift功能。

2 个答案:

答案 0 :(得分:5)

使用where,然后使用fillna并指定前向填充来填补损失和平局:

df['last_win'] = np.where(df['result'] == 'W', df['time'], np.NaN)
df.fillna(method="ffill", inplace=True)

答案 1 :(得分:4)

df['last win'] = df.loc[df.result=='W','time']
df['last win'] = df['last win'].ffill()