我正在尝试将两个数据帧合并到地址数据的不同组合上,但是,我很难实现一个循环来实现此目的。我想在以下各列上实现合并,这对于每个数据帧来说都是通用的,例如left_on = a
,而python为right_on从a
到h
循环。然后,该循环应与left_on = b
运行合并,然后从a
到h
中的right_on
循环,依此类推,直到尝试了所有组合。结果数据框应包含找到合并的所有行,同时还应将数据框与未找到合并的其余NaN值分开。
b = 'FULL ADDRESS1'
c = 'FULL ADDRESS2'
d = 'FULL ADDRESS3'
e = 'FULL ADDRESS4'
f = 'FULL ADDRESS5'
g = 'FULL ADDRESS6'
h = 'FULL ADDRESS7'
我发现了这种语法:
.append(pd.merge(df, df1, left_on = a, right_on = b)) \
.append(pd.merge(df, df1, left_on = a, right_on = c)) #etc etc
但是,考虑到使用append
,这将导致多个重复项。据我所知,用merge
替换也达不到预期的结果。任何帮助将非常感激!模糊匹配将不起作用,因为有太多数据需要处理。