(Python)熊猫数据框中的分组间隔

时间:2020-09-14 22:12:16

标签: python pandas dataframe

数据帧由许多列组成,列“ sec_time”以秒为单位(类型=浮点数)。 我试图对间隔和计数进行分组,所以我使用了以下代码:

data.groupby(pd.cut(user_data['sec_time'],[0,60,120,180,240,300,360,420])).count()

输出看起来像

 (0, 60] 2 
 (60,120] 8
 ...
 (360,420] 13

我得到了正确的输出,但是我不知道如何将最后一个间隔加到420+,这样我就不会错过任何值。我该怎么办?

1 个答案:

答案 0 :(得分:1)

您可以在最后一个存储桶中添加inf

data = pd.DataFrame({'sec_time': np.random.randint(0, 1000, 30)})
data.groupby(pd.cut(data['sec_time'],[0,60,120,180,240,300,360,420, float('inf')])).count()
                sec_time
sec_time                
(0.0, 60.0]            4
(60.0, 120.0]          2
(120.0, 180.0]         0
(180.0, 240.0]         1
(240.0, 300.0]         1
(300.0, 360.0]         0
(360.0, 420.0]         1
(420.0, inf]          21