我想知道如何将pandas loc与多个数据框一起使用。 我有三个数据框,需要过滤这些值(请注意,所有数据框的行数都不同)。
例如,我现在的代码很慢,看起来像这样:
df1['score'] = None
df1['complited_activities'] = 0
for i in range(len(df1)):
values = df_enrollment.iloc[i]
for j in range(len(df2)):
df2_values = score_df.iloc[j]
if values['fild_16'] == score_values['user_id'] and values['fild_15'] == score_values['course_id']:
df1.iloc[i, df1.columns.get_loc('score')] = score_values['progress_score']
for k in range(len(df3)):
sub_values = df3.iloc[k]
if values['fild_16'] == sub_values['user_id']:
df1.iloc[i, df1.columns.get_loc('complited_activities')] = sub_values['count']
在这里您可以看到,程序首先从df1 dataframe(values变量)获取行。 之后,它从df2数据帧中获取一行并检查此语句(values ['fild_16'] == score_values ['user_id']和values ['fild_15'] == score_values ['course_id'])。如果语句为true,则使用iloc设置列分数的值。 对df3进行相同的处理后
如果没有使用loc这样的循环,我如何做到这一点?
df1
fild_16, fild_15, score, complited_activities
1, 14, 0 None
2, 15, 0 None
3, 16, 0 None
4, 17, 0 None
df2
user_id, course_id
15 14
2 15
3 16
df3
user_id, score
135 145
2 42
4 412
Expected output:
fild_16, fild_15, score, complited_activities
1, 14, 0 None
2, 15, 1 42
3, 16, 1 None
4, 17, 0 412
In df1 fild_16 is user_id, fild_15 - course_id
谢谢