数据帧由许多列组成,列“ sec_time”以秒为单位(类型=浮点数)。 我试图对间隔和计数进行分组,所以我使用了以下代码:
data.groupby(pd.cut(user_data['sec_time'],[0,60,120,180,240,300,360,420])).count()
输出看起来像
(0, 60] 2
(60,120] 8
...
(360,420] 13
我得到了正确的输出,但是我不知道如何将最后一个间隔加到420+,这样我就不会错过任何值。我该怎么办?
答案 0 :(得分:1)
您可以在最后一个存储桶中添加inf
:
data = pd.DataFrame({'sec_time': np.random.randint(0, 1000, 30)})
data.groupby(pd.cut(data['sec_time'],[0,60,120,180,240,300,360,420, float('inf')])).count()
sec_time
sec_time
(0.0, 60.0] 4
(60.0, 120.0] 2
(120.0, 180.0] 0
(180.0, 240.0] 1
(240.0, 300.0] 1
(300.0, 360.0] 0
(360.0, 420.0] 1
(420.0, inf] 21