我有以下数据框(df):
Row Number
Row 0 0.24 0.16 -0.18 -0.20 1.24
Row 1 0.18 0.12 -0.73 -0.36 -0.54
Row 2 -0.01 0.25 -0.35 -0.08 -0.43
Row 3 -0.43 0.21 0.53 0.55 -1.03
Row 4 -0.24 -0.20 0.49 0.08 0.61
Row 5 -0.19 -0.29 -0.08 -0.16 0.34
我试图分别求和所有负数和正数,例如sum(neg_numbers)= n和sum(pos_numbers)= x
我尝试过:
df.groupby(df.agg([('negative' , lambda x : x[x < 0].sum()) , ('positive' , lambda x : x[x > 0].sum())])
无济于事。
我将如何对这些值求和?
提前谢谢!
答案 0 :(得分:2)
你可以
sum_pos = df[df>0].sum(1)
sum_neg = df[df<0].sum(1)
如果要获取每行的总和。如果要对所有值求和而不管行/列如何,可以使用np.nansum
sum_pos = np.nansum(df[df>0])
答案 1 :(得分:2)
您可以使用
df.mul(df.gt(0)).sum().sum()
Out[447]: 5.0
df.mul(~df.gt(0)).sum().sum()
Out[448]: -5.5
如果需要按行求和
df.mul(df.gt(0)).sum()
Out[449]:
1 0.42
2 0.74
3 1.02
4 0.63
5 2.19
dtype: float64
答案 2 :(得分:2)
另一种总计方式:
sum_pos = df.to_numpy().flatten().clip(min=0).sum()
sum_neg = df.to_numpy().flatten().clip(max=0).sum()
对于按列求和:
sum_pos_col = sum(df.to_numpy().clip(min=0))
sum_neg_col = sum(df.to_numpy().clip(max=0))