Question

熊猫相对较新 - 我有一个包含电影ID，用户ID，评级和日期的数据框。我按用户ID和日期排序，并在下面显示数据框。

https://i.stack.imgur.com/fqSZ6.png

我想要的输出是一个csv，每个用户有一行，用户评价的所有电影按时间顺序从左到右排序。例如：

452 4 33 6581
56
121 69 98 802 555
.
.

master_sample.sort_values(['User ID','Date']).groupby('User ID')

然而，在按用户ID分组后，我得到一个groupby对象，我不确定如何迭代并输出到csv。我已尝试使用get_group尝试使用原始df /迭代分组df进行调整。

任何指针都将不胜感激！

Answer 1

试试这个：

        x1      x2      x3      x4      x5      x6      x7      x8      x9      x10     x11     x12
Group 1 FALSE   TRUE    TRUE    TRUE    TRUE    TRUE    TRUE    TRUE    FALSE   FALSE   FALSE   FALSE
Group 1 FALSE   TRUE    TRUE    FALSE   FALSE   FALSE   TRUE    TRUE    FALSE   FALSE   FALSE   FALSE
Group 1 FALSE   TRUE    TRUE    FALSE   FALSE   FALSE   TRUE    TRUE    FALSE   FALSE   FALSE   FALSE
Group 1 FALSE   TRUE    TRUE    FALSE   FALSE   TRUE    TRUE    TRUE    FALSE   FALSE   FALSE   FALSE
Group 1 FALSE   TRUE    TRUE    FALSE   FALSE   TRUE    TRUE    TRUE    FALSE   FALSE   FALSE   FALSE
Group 1 FALSE   TRUE    TRUE    FALSE   FALSE   TRUE    TRUE    TRUE    FALSE   FALSE   FALSE   FALSE

将转置的分组pandas数据帧输出到CSV

1 个答案: