我有一个只有3个特征的数据集。功能包括人物,电影和日期。我想查找一个人观看某部电影的日期不同。因此,对于每个人,我想统计一下她看过那部电影多少天了。如果可能的话,甚至可能每天出现几次,但是主要焦点是多少天。
movie person Day
0 le vie john 2017-09-21
1 friends sarah 2017-09-21
2 giraffe maggie 2017-09-21
3 maome mark 2017-09-21
4 tarzan faby 2017-09-25
5 heaven elisa 2017-09-25
6 moon lucy 2017-09-25
7 king kong philip 2017-09-25
8 la la land hannah 2017-09-25
它持续数千行。 任何人都有任何想法,我主要尝试过groupbys,但是我不确定我能从中得到我想要的东西。感谢帮助。 谢谢,
答案 0 :(得分:1)
(假设您使用的是熊猫)
怎么样呢?
df.groupby(['actor', 'action_query_phone']).Day.nunique()
这可让您每个人观看每部电影多少天(不显示观看0天的条目)