做非常相似的熊猫索引匹配的快速方法?

时间:2019-07-02 14:47:23

标签: python pandas

当我反复执行基于相同唯一标识符的索引匹配时,我要重复很多代码。您建议如何更有效地编写此内容?

基本上,我有5个以上具有相同唯一标识符(称为AI_Code)的数据集,只需要为我的主数据帧(称为Internal_df)提取每个数据。

我一直在制作字典并映射它,但是感觉有一种更快的方法。我是否应该在要接收的每个列之前预先创建一个新的数据框,然后为我的主数据框引用该列?

请参见下面如何从3个不同的数据集中获取信息。请注意,每个集合如何总是以Internal_df['AI_Code'].map...结尾:

#Setting Crosswalk data
AI_Active_map = dict(Xwalk_DF.set_index('AI_Code').Xwalk_DF['AI_Code_Active (2018-19)'])
Internal_df['Active AI'] = Internal_df['AI Code'].map(AI_Active_map)

FSC_map = dict(Xwalk_DF.set_index('AI_Code').Xwalk_DF['B/CO'])
Internal_df['FSC'] = Internal_df['AI_Code'].map(FSC_map)

#Setting Coordinator data
SD_map = dict(Coordinator_DF.set_index('AI Code').Coordinator_DF['SD_Name'])
Internal_df['SAT Coordinator'] = Internal_df['AI_Code'].map(SD_map)

#Setting Ordering data
TOS_map = dict(Ordering_DF.set_index('AI Code').Coordinator_DF['TOS Access Code'])
Internal_df['TOS ACCESS'] = Internal_df['AI_Code'].map(TOS_map)

ShouldPSAT_map = dict(Ordering_DF.set_index('AI Code').Coordinator_DF['PSAT Should'])
Internal_df['PSAT Order'] = Internal_df['AI_Code'].map(ShouldPSAT_map)

0 个答案:

没有答案