基于单独列中行总和的结果返回值

时间:2019-07-07 13:31:18

标签: python pandas numpy loc

我正在尝试创建一个新列(D列),如果在接下来的5行中(上方)随时CLOSE时更改该值,则该列返回一个SELL值(即452.37)达到较低的5%值。 (即452.37 / 1.05 = 432.85)出现在第5行上。

我的数据框如下,第D行是我想要的样子

df = pd.DataFrame()

df['A'] = ('1/05/2019','2/05/2019','3/05/2019','4/05/2019','5/05/2019',
           '6/05/2019','7/05/2019','8/05/2019','9/05/2019','10/05/2019')
df['B'] = (460.97, 454.50, 439.00, 438.04, 433.00,
           428.01, 440.00, 437.69, 452.37, 455.93)
df['C'] = ('-', '-', '-', '-', '-', '-', '-', '-', 'SELL', '-')
df['D'] = ('-', '-', '-', '-', '-', 'CLOSE', '-', '-', '-', '-')

print(df)

1 个答案:

答案 0 :(得分:1)

根据给出的描述,您似乎可以结合移动B,计算滚动最大值,并将此滚动最大值与B的“当前”值进行比较:

df['D2'] = np.where((pd.Series(np.where(df['C'] == 'SELL', 
                    df['B'],
                    0)).shift(-5).rolling(5, min_periods=1).max() / df['B']) > 1.05,
                    'CLOSE',
                    '-')
print(df)

返回

            A       B     C      D     D2
0   1/05/2019  460.97     -      -      -
1   2/05/2019  454.50     -      -      -
2   3/05/2019  439.00     -      -      -
3   4/05/2019  438.04     -      -      -
4   5/05/2019  433.00     -      -      -
5   6/05/2019  428.01     -  CLOSE  CLOSE
6   7/05/2019  440.00     -      -      -
7   8/05/2019  437.69     -      -      -
8   9/05/2019  452.37  SELL      -      -
9  10/05/2019  455.93     -      -      -