Question

我正在阅读两个带有pandas的csv文件。

df1= pd.read_csv('file_1.csv')
df2 = pd.read_csv('file_2.csv')
data =  pd.merge(df1, df2, on='id')

我面临的问题是最终数据帧数据的行数较少，因为两个输入文件都缺少一些id值。我想做的是为所有单元格设置一个默认值两种情况，如：

data =  pd.merge(df1, df2, on='id',default_vaue=0)

Answer 1

您可以使用outer join并将NaN替换为0：

注意：所有N aN都替换为0，因此NaN或df1中的df2也会被替换。

data = pd.merge(df1, df2, on='id',how='outer').fillna(0)