Question

当我反复执行基于相同唯一标识符的索引匹配时，我要重复很多代码。您建议如何更有效地编写此内容？

基本上，我有5个以上具有相同唯一标识符（称为AI_Code）的数据集，只需要为我的主数据帧（称为Internal_df）提取每个数据。

我一直在制作字典并映射它，但是感觉有一种更快的方法。我是否应该在要接收的每个列之前预先创建一个新的数据框，然后为我的主数据框引用该列？

请参见下面如何从3个不同的数据集中获取信息。请注意，每个集合如何总是以Internal_df['AI_Code'].map...结尾：

#Setting Crosswalk data
AI_Active_map = dict(Xwalk_DF.set_index('AI_Code').Xwalk_DF['AI_Code_Active (2018-19)'])
Internal_df['Active AI'] = Internal_df['AI Code'].map(AI_Active_map)

FSC_map = dict(Xwalk_DF.set_index('AI_Code').Xwalk_DF['B/CO'])
Internal_df['FSC'] = Internal_df['AI_Code'].map(FSC_map)

#Setting Coordinator data
SD_map = dict(Coordinator_DF.set_index('AI Code').Coordinator_DF['SD_Name'])
Internal_df['SAT Coordinator'] = Internal_df['AI_Code'].map(SD_map)

#Setting Ordering data
TOS_map = dict(Ordering_DF.set_index('AI Code').Coordinator_DF['TOS Access Code'])
Internal_df['TOS ACCESS'] = Internal_df['AI_Code'].map(TOS_map)

ShouldPSAT_map = dict(Ordering_DF.set_index('AI Code').Coordinator_DF['PSAT Should'])
Internal_df['PSAT Order'] = Internal_df['AI_Code'].map(ShouldPSAT_map)

做非常相似的熊猫索引匹配的快速方法？

0 个答案: