熊猫分组,然后在另一列中找到每组的最大值

时间:2021-06-16 16:21:59

标签: pandas dataframe pandas-groupby

This is not the whole dataset, just .head(10)

我想要一个包含 3 列的数据框:groupby user_id

  1. 'user_id'

  2. 每个“user_id”订购最多的“product_id”(每个“user_id”在“uxp_total_bought”中的最大值)

  3. 购买了多少次(‘uxp_total_bought’)

What I expect:

1 个答案:

答案 0 :(得分:0)

我认为以下方法可行。

test = your_dataset.groupby('product_id')['uxp_total_bought'].max()
test = test.reset_index()
test = your_dataset.loc[uxp.groupby("user_id")["uxp_total_bought"].idxmax()]
del test["uxp_total_bought"]
test.rename(columns = {"product_id":"favourite_product_id"}, inplace = True)