找出一个值在distinctDay

时间:2018-12-20 17:43:47

标签: python pandas count distinct analytics

我有一个只有3个特征的数据集。功能包括人物,电影和日期。我想查找一个人观看某部电影的日期不同。因此,对于每个人,我想统计一下她看过那部电影多少天了。如果可能的话,甚至可能每天出现几次,但是主要焦点是多少天。

                    movie          person         Day
0                  le vie            john  2017-09-21
1                 friends           sarah  2017-09-21
2                 giraffe          maggie  2017-09-21
3                   maome            mark  2017-09-21
4                  tarzan            faby  2017-09-25
5                  heaven           elisa  2017-09-25
6                    moon            lucy  2017-09-25
7               king kong          philip  2017-09-25
8              la la land          hannah  2017-09-25

它持续数千行。 任何人都有任何想法,我主要尝试过groupbys,但是我不确定我能从中得到我想要的东西。感谢帮助。 谢谢,

1 个答案:

答案 0 :(得分:1)

(假设您使用的是熊猫)

怎么样呢?

df.groupby(['actor', 'action_query_phone']).Day.nunique()

这可让您每个人观看每部电影多少天(不显示观看0天的条目)