Question

如果我有这样的数据框：

   1  2  3  4  5
 1 2  4  5 NaN 3
 2 3  5  6  1  2
 3 3  1  1  1  1

我如何对每一行求和并用总和替换该行中的值，这样我就得到了这样的东西：

   1   2  3  4  5
 1 14 14 14 NaN 14
 2 17 17 17 17  17
 3 7  7  7  7   7

Answer 1

使用mask将所有不丢失的值替换为sum：

df = df.mask(df.notnull(), df.sum(axis=1), axis=0)
print (df)
    1   2   3     4   5
1  14  14  14   NaN  14
2  17  17  17  17.0  17
3   7   7   7   7.0   7

或将numpy.broadcast_to与numpy.where一起使用：

arr = df.values
a = np.broadcast_to(np.nansum(arr, axis=1)[:, None], df.shape)
df = pd.DataFrame(np.where(np.isnan(arr), np.nan, a),
                  index=df.index, columns=df.columns)

#alternative
df[:] = np.where(np.isnan(arr), np.nan, a)
print (df)
      1     2     3     4     5
1  14.0  14.0  14.0   NaN  14.0
2  17.0  17.0  17.0  17.0  17.0
3   7.0   7.0   7.0   7.0   7.0

Answer 2

使用mul

df.notnull().replace(False,np.nan).mul(df.sum(1),axis=0).astype(float)
      1     2     3     4     5
1  14.0  14.0  14.0   NaN  14.0
2  17.0  17.0  17.0  17.0  17.0
3   7.0   7.0   7.0   7.0   7.0

如何对每一行求和并用sum替换行中的每个值？

2 个答案: