我想基于多个列连接两个数据帧,因为数据集中有重复的ID。
我尝试了几种方法,下面列出了其中一种。 但是,我做对了。下面的选项为我提供了两个数据框的所有行。我认为这应该很容易,但是由于某些原因,它没有用。 我检查了结果。有比赛,而不是参加比赛,我只是在最终数据帧中获得了两行。
我正在比较两个不同的数据集以确保两个数据集中都存在相同的ID。可以有多个事务具有相同的ID,但是我需要确保所有存在于一个数据帧中的所有数据也都存在于其他。
new_df = Enterprise.merge(Tableau,
left_on=['ID','AID','Amount','Tax','CC'],
right_on = ['ID','AID','Amount','Tax','CC'],
how='left')