我有一个格式为的数据框:
bank_number pixel_id
00:00:00 1 773872
00:00:00.000001 1 754607
00:00:00.000002 2 758142
00:00:00.000003 2 780649
00:00:00.000004 1 734804
我想根据索引的频率计算唯一条目的数量(bank_number
和pixel_id
)。
我可以使用df.resample("100us")
或df.groupby(pd.Grouper(freq='100us'))
按频率对索引进行重新取样/分组。
E.g:
In [10]: df.resample("100us").sum()
Out[10]:
bank_number pixel_id
00:00:00 100000 75387050532
00:00:00.000100 100000 75375499992
00:00:00.000200 100000 75383627514
00:00:00.000300 100000 75385717582
我可以使用df.groupby(["bank_number", "pixel_id"]).size()
获取唯一条目:
bank_number pixel_id
0 1311297 1
1311303 1
1311304 5
但不是两个在一起...... 非常感谢帮助。
答案 0 :(得分:0)
您可以通过连接bank_number和pixel_id
来创建第3列bank_pixel_id然后再做
df.groupby(pd.Grouper(freq='100us'))['bank_pixel_id'].agg('count')