pandas qcut()方法如何选择放置额外项目的箱子?

时间:2017-08-03 13:52:27

标签: python algorithm binning

我想了解pd.qcut()numItems % binSize != 0时如何选择放置额外项目的位置。例如,我编写了这段代码来检查在十进制设置中如何分区0-9个项目

for i in range(10):
    a = pd.qcut(pd.Series(range(i+10)),10,False).value_counts().ix[range(10)].tolist()
    a = [x-1 for x in a]
    print(str(i),'extra:',a)

0 extra: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
1 extra: [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]
2 extra: [1, 0, 0, 0, 0, 0, 0, 0, 0, 1]
3 extra: [1, 0, 0, 0, 1, 0, 0, 0, 0, 1]
4 extra: [1, 0, 0, 1, 0, 0, 1, 0, 0, 1]
5 extra: [1, 0, 1, 0, 1, 0, 0, 1, 0, 1]
6 extra: [1, 1, 0, 1, 0, 1, 0, 1, 0, 1]
7 extra: [1, 1, 0, 1, 1, 0, 1, 0, 1, 1]
8 extra: [1, 1, 1, 0, 1, 1, 0, 1, 1, 1]
9 extra: [1, 1, 1, 1, 1, 0, 1, 1, 1, 1]

当然,这会随着numItemsbinSize的变化而变化。您是否了解算法如何工作以尝试选择放置额外项目的位置?它似乎试图以某种方式平衡它们

0 个答案:

没有答案