我在数据框上执行以下操作:
df['Age_Groups'] = pd.cut(df.Age, [0, 60, 120, 240, 360, 480, 600, 720, 940],
labels=['0-5', '5-10', '11-20', '21-30', '31-40', '41-50', '51-60', '> 60'])
这是否意味着0到60的值包含在'0-5'中?例如,排除60,或者在0-5中排除零,
答案 0 :(得分:1)
您必须将标签放在标签上:
df['Age_Groups'] = pd.cut(df.Age, [0,6,10], labels=['0-5', '6-10'],right=False)
"""
Age Age_Groups
0 0 0-5
1 1 0-5
2 2 0-5
3 3 0-5
4 4 0-5
5 5 0-5
6 6 6-10
7 7 6-10
8 8 6-10
9 9 6-10
10 10 NaN
"""
From the docs,默认排除左边界,右边包括:
对:bool,可选 指示箱是否包括最右边。如果right == True(默认值),那么bin [1,2,3,4]表示(1,2],(2,3),(3,4)。
此处(right = False
)0,6恰恰相反[,6)
。