我需要加入2个df
,A
和B
,根据另一个B
的{{1}}生成groupby
,即df
,
C
我想知道在内存使用和时间效率方面有更好的方法。
B = pd.DataFrame(C.groupby('object_id').apply(
lambda x: x[['number', 'date', 'user_id', 'change']].to_dict('records')))
B.columns = ['change_history']
B['num_changes'] = B['change_history'].apply(lambda x: len(x))
# reset index to default integer index to get object_id for B
B = B.reset_index()
data = A.merge(B, how='left', on='object_id')