标签: python pandas dataframe
我有两个数据框,它们的信息各不相同,但两个数据框都有一个account_number列,我希望与之合并。
问题在于:
其中一个数据框具有完整的帐号,例如12345678,而另一个数据框具有掩码的帐号,但后四位数字除外,因此类似于****5678。
12345678
****5678
我确定每个帐号的后四位数字都是不同的,所以如果后四位数字匹配,我将如何将数据框合并到内部联接中?
谢谢您的帮助。
答案 0 :(得分:1)
我假设这些列为字符串格式,如果不是,请更新您的问题以指定。
如果您确定后四位数字是唯一的,我将使用后四位创建一个新列,然后合并。这可以通过使用map和lambda来完成。
df1['last_four'] = df1['account_number'].map(lambda x: x[-4:]) df2['last_four'] = df2['account_number'].map(lambda x: x[-4:])