我想使用百分位数范围将数据分成10个区间(直方图):
bins = [0, 10th-percentile(myData), 20th-percentile(myData), 30th..., 90th-percentile(myData), +inf]
因此,为了从我的数据中制作直方图,我只是这样做:
import numpy as np
myBinnedData = np.histogram(myData, bins=bins)[0]
我的问题是我在myData
中有几个联系,只要一个领带跨越两个分区或更多,np.histogram
就会把所有第一个bin中的值,并将第二个bin留空。
这是因为 bin范围将连续两个相等的值(X-percentile(myData) == Y-percentile(myData)
我如何解释这个?