熊猫相对较新 - 我有一个包含电影ID,用户ID,评级和日期的数据框。我按用户ID和日期排序,并在下面显示数据框。
https://i.stack.imgur.com/fqSZ6.png
我想要的输出是一个csv,每个用户有一行,用户评价的所有电影按时间顺序从左到右排序。例如:
452 4 33 6581
56
121 69 98 802 555
.
.
master_sample.sort_values(['User ID','Date']).groupby('User ID')
然而,在按用户ID分组后,我得到一个groupby对象,我不确定如何迭代并输出到csv。我已尝试使用get_group尝试使用原始df /迭代分组df进行调整。
任何指针都将不胜感激!
答案 0 :(得分:1)
试试这个:
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12
Group 1 FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE FALSE FALSE FALSE
Group 1 FALSE TRUE TRUE FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE
Group 1 FALSE TRUE TRUE FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE
Group 1 FALSE TRUE TRUE FALSE FALSE TRUE TRUE TRUE FALSE FALSE FALSE FALSE
Group 1 FALSE TRUE TRUE FALSE FALSE TRUE TRUE TRUE FALSE FALSE FALSE FALSE
Group 1 FALSE TRUE TRUE FALSE FALSE TRUE TRUE TRUE FALSE FALSE FALSE FALSE