熊猫数据框上的部分字符串合并

时间:2019-10-23 19:06:51

标签: python pandas dataframe

我有两个数据框,它们的信息各不相同,但两个数据框都有一个account_number列,我希望与之合并。

问题在于:

其中一个数据框具有完整的帐号,例如12345678,而另一个数据框具有掩码的帐号,但后四位数字除外,因此类似于****5678

我确定每个帐号的后四位数字都是不同的,所以如果后四位数字匹配,我将如何将数据框合并到内部联接中?

谢谢您的帮助。

1 个答案:

答案 0 :(得分:1)

我假设这些列为字符串格式,如果不是,请更新您的问题以指定。

如果您确定后四位数字是唯一的,我将使用后四位创建一个新列,然后合并。这可以通过使用maplambda来完成。

df1['last_four'] = df1['account_number'].map(lambda x: x[-4:])
df2['last_four'] = df2['account_number'].map(lambda x: x[-4:])