在pandas

时间:2017-12-07 13:31:06

标签: python pandas csv

我正在阅读两个带有pandas的csv文件。

df1= pd.read_csv('file_1.csv')
df2 = pd.read_csv('file_2.csv')
data =  pd.merge(df1, df2, on='id')

我面临的问题是最终数据帧数据的行数较少,因为两个输入文件都缺少一些id值。我想做的是为所有单元格设置一个默认值两种情况,如:

data =  pd.merge(df1, df2, on='id',default_vaue=0)

1 个答案:

答案 0 :(得分:1)

您可以使用outer join并将NaN替换为0

注意:所有N aN都替换为0,因此NaNdf1中的df2也会被替换。

data = pd.merge(df1, df2, on='id',how='outer').fillna(0)