This is not the whole dataset, just .head(10)
我想要一个包含 3 列的数据框:groupby user_id
'user_id'
每个“user_id”订购最多的“product_id”(每个“user_id”在“uxp_total_bought”中的最大值)
购买了多少次(‘uxp_total_bought’)
答案 0 :(得分:0)
我认为以下方法可行。
test = your_dataset.groupby('product_id')['uxp_total_bought'].max()
test = test.reset_index()
test = your_dataset.loc[uxp.groupby("user_id")["uxp_total_bought"].idxmax()]
del test["uxp_total_bought"]
test.rename(columns = {"product_id":"favourite_product_id"}, inplace = True)