根据熊猫数据帧中的条件获取最大值和最小值

时间:2021-03-07 12:41:53

标签: python pandas dataframe min

我有一个这样的数据框

<头>
计数 A B 总计
是的 4900 0 0
是的 1000 1000 0
sum_yes 5900 1000 0
是的 4000 0 0
是的 1000 0 0
sum_yes 5000 0 0

我想要这样的结果,即仅针对 'count' = 'sum_yes' 的行计算 A 列和 B 列的最大值,如果 B 的值 =0,否则计算最小值

<头>
计数 A B 总计
是的 4900 0 0
是的 1000 1000 0
sum_yes 5900 1000 1000
是的 4000 0 0
是的 1000 0 0
sum_yes 5000 0 5000

到目前为止我已经尝试过:

df['Total'] = [df[['A', 'B']].where(df['count'] == 'sum_yes').max(axis=0) if 
                   'B'==0 else df[['A', 'B']]
                   .where(df['count'] == 'sum_yes').min(axis=0)]

但我收到 ValueError 一个系列的真值不明确。使用 a.empty、a.bool()、a.item()、a.any() 或 a.all()

知道如何解决这个问题

1 个答案:

答案 0 :(得分:1)

您可以使用numpy.where

new_values = np.where((df["count"] == "sum_yes") & (df.B == 0),
                       df.loc[:, ["A", "B"]].max(1),
                       df.loc[:, ["A", "B"]].min(1),
                      )

df.assign(Total = new_values)


     count     A     B  Total
0      yes  4900     0      0
1      yes  1000     0      0
2  sum_yes  5900  1000   1000
3      yes  4000  1000   1000
4      yes  1000     0      0
5  sum_yes  5000     0   5000