初始表格
workbook=pd.read_csv("Scores.csv")
workbook['Scores'].head(4)
输出
Scores
22
54
70
0
分箱代码
bins = [0, 25, 50, 75, 100, 125, 150, 175, 200, 225]
workbook['Score Bins'] = pd.cut(workbook['Scores'], bins)
print (workbook.head(4))
合并后的输出
Scores Score Bins
22 (0, 25]
54 (50,75]
209 (200, 225]
0 (0, 25]
我找不到与每个bin对应的值的数量。 例如,我想找出bin中有多少值(分别为0、25、25、50等)。
我想要的输出
Number of values in bin (0,25]: _____
Number of values in bin (25,50]: _____
and so on
请在这里帮助。
答案 0 :(得分:1)
workbook['Score Bins'].value_counts()
答案 1 :(得分:1)
我建议使用value_counts
方法:
workbook['Score Bins'].value_counts()
它将返回一个熊猫系列,其中包含特定列的每个唯一值的计数,例如:
(200, 225] 25
(175, 200] 25
(150, 175] 25
(125, 150] 25
(100, 125] 25
(75, 100] 25
(50, 75] 25
(25, 50] 25
(0, 25] 25