如何映射两个数据框,使一个数据框的值保持不变

时间:2019-05-06 19:41:45

标签: python pandas etl

我正在尝试为一些ETL转换编写脚本。我有34个固定列,即df1,根据它们我必须映射包含不同列即df2的不同输入文件的列名。

df1(标准列):

df1 : Standard Columns

df2:

df2: input file

我尝试过df.merge,但这似乎无法解决我的问题。

预期结果是输入文件df2中的列将与same column name映射为df1,而same order映射为df2原始值保持不变。

预期结果:

Result

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:1)

执行此操作的一种方法是具有映射列的中间步骤。 例如:

df2.rename(columns = {'Department Code':'Field 1 Dept Number','Column2':'2_column', .....})

然后您可以合并感兴趣的列上的两个数据框。