我正在阅读两个带有pandas的csv文件。
df1= pd.read_csv('file_1.csv')
df2 = pd.read_csv('file_2.csv')
data = pd.merge(df1, df2, on='id')
我面临的问题是最终数据帧数据的行数较少,因为两个输入文件都缺少一些id值。我想做的是为所有单元格设置一个默认值两种情况,如:
data = pd.merge(df1, df2, on='id',default_vaue=0)
答案 0 :(得分:1)
您可以使用outer join
并将NaN
替换为0
:
注意:所有N aN
都替换为0
,因此NaN
或df1
中的df2
也会被替换。
data = pd.merge(df1, df2, on='id',how='outer').fillna(0)