一个简单的例子:
d=pd.DataFrame({'x':np.arange(100)})
d.x.value_counts(normalize=True,bins=5)
然后我得到:
Out[61]:
(79.2, 99.0] 0.2
(59.4, 79.2] 0.2
(39.6, 59.4] 0.2
(19.8, 39.6] 0.2
(-0.1, 19.8] 0.2
Name: x, dtype: float64
我可以自己设置间隔。例如,我想获得
的频率(0,23],(23,50],(50,100]
间隔的范围可能不相等。
答案 0 :(得分:1)
您可以通过bins
来传递自己的value_counts
d.x.value_counts(bins=[0,23,50,100])
Out[197]:
(50.0, 100.0] 49
(23.0, 50.0] 27
(-0.001, 23.0] 24
Name: x, dtype: int64