抱歉,如果我的标题不清楚。
我想知道在不同的地区,有多少人在不同时间停车。
我有这个数据框。
UserId | Postcode | Time |
A 3000 20:00
B 3000 20:00
C 3100 20:00
D 3000 1:00
E 1000 5:00
F 4000 10.00
我把时间切成最近的小时,所以13.20pm切成13.00便于分组。
我想在不同的时间计算每个邮政编码的用户数量。
例如,有2位用户在邮政编码3000的20:00 - 21:00停放。
这是我想要的结果
Count | Postcode | Time
1 1000 5:00
2 3000 20:00
1 3000 1.00
1 3100 20:00
1 4000 10.00
谢谢
答案 0 :(得分:2)
您可以使用groupby和count
df.groupby(['Postcode', 'Time']).UserId.count().reset_index()
你得到了
Postcode Time UserId
0 1000 5:00 1
1 3000 1:00 1
2 3000 20:00 2
3 3100 20:00 1
4 4000 10.00 1