熊猫具有多个数据框

时间:2020-05-21 10:00:23

标签: python pandas data-science loc

我想知道如何将pandas loc与多个数据框一起使用。 我有三个数据框,需要过滤这些值(请注意,所有数据框的行数都不同)。

例如,我现在的代码很慢,看起来像这样:

    df1['score'] = None
    df1['complited_activities'] = 0
    for i in range(len(df1)):
        values = df_enrollment.iloc[i]
        for j in range(len(df2)):
            df2_values = score_df.iloc[j]
            if values['fild_16'] == score_values['user_id'] and values['fild_15'] == score_values['course_id']:
                df1.iloc[i, df1.columns.get_loc('score')] = score_values['progress_score']
        for k in range(len(df3)):
            sub_values = df3.iloc[k]
            if values['fild_16'] == sub_values['user_id']:
                df1.iloc[i, df1.columns.get_loc('complited_activities')] = sub_values['count']

在这里您可以看到,程序首先从df1 dataframe(values变量)获取行。 之后,它从df2数据帧中获取一行并检查此语句(values ['fild_16'] == score_values ['user_id']和values ['fild_15'] == score_values ['course_id'])。如果语句为true,则使用iloc设置列分数的值。 对df3进行相同的处理后

如果没有使用loc这样的循环,我如何做到这一点?

df1
fild_16, fild_15, score, complited_activities
1,         14,      0          None
2,         15,      0          None
3,         16,      0          None
4,         17,      0          None
df2
user_id, course_id
15          14
2           15
3           16
df3
user_id,   score
135         145
2           42
4           412

Expected output:
fild_16, fild_15, score, complited_activities
1,         14,      0          None
2,         15,      1          42
3,         16,      1          None
4,         17,      0          412

In df1 fild_16 is user_id, fild_15 - course_id

谢谢

0 个答案:

没有答案