Question

我有两个数据帧df1和df2： df1如下所示：

df2如下所示：

我想用df1中的相应条目替换df2中的所有零。换句话说，如果df2中某个索引处的元素为零，那么我希望这个元素被df1中的相应条目替换。

因此，我希望df2看起来像：

我尝试使用替换方法，但它无法正常工作。请帮忙：）提前谢谢。

Answer 1

您可以使用where：

In [19]: df2.where(df2 != 0, df1)
Out[19]: 
   age
0   42
1   52
2    1
3   24
4   73

上面，df2 != 0是一个布尔数据框架。

In [16]: df2 != 0
Out[16]: 
     age
0  False
1  False
2   True
3  False
4  False

df2.where(df2 != 0, df1)会返回一个新的DataFrame。如果df2 != 0为True，则使用df2的对应值。如果为False，则使用df1的对应值。

另一种方法是使用df.loc进行作业：

df2.loc[df2['age'] == 0, 'age'] = df1['age']

df.loc[mask, col]选择df行，其中布尔系列，mask为True，列标签为col。

In [17]: df2.loc[df2['age'] == 0, 'age']
Out[17]: 
0    0
1    0
3    0
4    0
Name: age, dtype: int64

在作业中使用时，例如df2.loc[df2['age'] == 0, 'age'] = df1['age']， Pandas执行自动索引标签对齐。（注意上面的索引标签是0,1,3,4 - 跳过2）。因此，df2.loc[df2['age'] == 0, 'age']中的值将替换为d1['age']中的相应值。即使d1['age']是包含索引标记0，1，2，3和4的系列，2被忽略，因为左侧没有相应的索引标签。

换句话说，

df2.loc[df2['age'] == 0, 'age'] = df1.loc[df2['age'] == 0, 'age']

也可以，但右侧增加的限制是不必要的。

Answer 2

In [30]: df2.mask(df2==0).combine_first(df1)
Out[30]:
    age
0  42.0
1  52.0
2   1.0
3  24.0
4  73.0

或“否定”beautiful @unutbu's solution：

In [46]: df2.mask(df2==0, df1)
Out[46]:
   age
0   42
1   52
2    1
3   24
4   73

Answer 3

或尝试mul

df1.mul(np.where(df2==1,0,1)).replace({0:1})

将一个数据帧中的零替换为另一个数据帧中的值

3 个答案: