当我反复执行基于相同唯一标识符的索引匹配时,我要重复很多代码。您建议如何更有效地编写此内容?
基本上,我有5个以上具有相同唯一标识符(称为AI_Code
)的数据集,只需要为我的主数据帧(称为Internal_df
)提取每个数据。
我一直在制作字典并映射它,但是感觉有一种更快的方法。我是否应该在要接收的每个列之前预先创建一个新的数据框,然后为我的主数据框引用该列?
请参见下面如何从3个不同的数据集中获取信息。请注意,每个集合如何总是以Internal_df['AI_Code'].map...
结尾:
#Setting Crosswalk data
AI_Active_map = dict(Xwalk_DF.set_index('AI_Code').Xwalk_DF['AI_Code_Active (2018-19)'])
Internal_df['Active AI'] = Internal_df['AI Code'].map(AI_Active_map)
FSC_map = dict(Xwalk_DF.set_index('AI_Code').Xwalk_DF['B/CO'])
Internal_df['FSC'] = Internal_df['AI_Code'].map(FSC_map)
#Setting Coordinator data
SD_map = dict(Coordinator_DF.set_index('AI Code').Coordinator_DF['SD_Name'])
Internal_df['SAT Coordinator'] = Internal_df['AI_Code'].map(SD_map)
#Setting Ordering data
TOS_map = dict(Ordering_DF.set_index('AI Code').Coordinator_DF['TOS Access Code'])
Internal_df['TOS ACCESS'] = Internal_df['AI_Code'].map(TOS_map)
ShouldPSAT_map = dict(Ordering_DF.set_index('AI Code').Coordinator_DF['PSAT Should'])
Internal_df['PSAT Order'] = Internal_df['AI_Code'].map(ShouldPSAT_map)