熊猫用前一行值乘以另一列填充nan

时间:2020-08-29 16:41:55

标签: python pandas

我有一个数据框,我想用与pct_change列混用的前几行的值来填充nan

    col_to_fill       pct_change
0       1                NaN
1       2                1.0
2       10               0.5
3       nan              0.5
4       nan              1.3
5       nan              2
6       5                3

对于3rd row 10*0.5 = 5来说,并使用该填充值填充下一行(如果它的值是nan)。

    col_to_fill        pct_change
0       1                NaN
1       2                1.0
2       10               0.5
3       5                0.5
4       6.5              1.3
5       13               2
6       5                3

我用过这个

while df['col_to_fill'].isna().sum() > 0:
    df.loc[df['col_to_fill'].isna(), 'col_to_fill'] = df['col_to_fill'].shift(1) * df['pct_change']

但是它花了太多的时间,因为它只能一次循环地填充上一行不是nannan的那一行。

1 个答案:

答案 0 :(得分:7)

cumprod之后尝试ffill

s = df.col_to_fill.ffill()*df.loc[df.col_to_fill.isna(),'pct_change'].cumprod()
df.col_to_fill.fillna(s, inplace=True)
df
Out[90]: 
   col_to_fill  pct_change
0          1.0         NaN
1          2.0         1.0
2         10.0         0.5
3          5.0         0.5
4          6.5         1.3
5         13.0         2.0
6          5.0         3.0