我的数据集包含他们购买的 usersID 和 itemsID 列。 每个用户可能购买了 1 件以上的商品。
我需要做一个列表,这样key就是userID,value是他购买的itemsID 例如,如果 user_1 购买了 [item_20,item_25,item_32],我的数据集包含该用户的 3 行,如下所示
row_1= 1,20 row_2= 1,25 row_3= 1,32
我希望我的列表具有 fromat {1: [20,25,32]}
我想为我的数据集中的所有用户创建一个列表,如上例所示。
答案 0 :(得分:0)
如果我理解正确,你想要这样的东西!
下次看看你尝试过什么会有所帮助
df = pd.DataFrame({'user': ['K0', 'K0', 'K2', 'K3', 'K4', 'K5'],
'product': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5']})
my_final_list={}
grouped_df=df.groupby(by=["user"])
for key, item in grouped_df:
products_list=list(grouped_df.get_group(key)["product"])
my_final_list[key]=products_list
print(my_final_list)