如何将numpy数组中的值组织成包含特定值范围的bin?

时间:2013-07-01 21:00:34

标签: python arrays numpy bins

我正在尝试对numpy数组中的值进行排序,以便我可以存储某个范围内的所有值(这可能会更好地表达)。无论如何,生病了一个例子,说明我想做什么。我有一个名为bin的数组,如下所示:

bins = array([11,11.5,12,12.5,13,13.5,14])

我还有另一个名为avgs的数组:

avgs = array([11.02, 13.67, 11.78, 12.34, 13.24, 12.98, 11.3, 12.56, 13.95, 13.56,
              11.64, 12.45, 13.23, 13.64, 12.46, 11.01, 11.87, 12.34, 13,87, 13.04,
              12.49, 12.5])

我要做的是找到avgs数组的值范围介于bins数组之间的范围。例如,我试图创建一个while循环,为每个bin创建新的变量。第一个bin将是bins[0] and bins[1]之间的所有内容,看起来像:

bin1 = array([0, 6, 15])

这些索引值对应avgs中的值11.02,11.3和11.01,并且是avgs中索引值0和1之间bins的值。我还需要其他箱子,所以另一个例子是:

bin2 = array([2, 10, 16])

然而,这对我来说具有挑战性的部分是binsavgs的大小会根据其他参数而变化,所以我试图构建一些可以扩展到更大或更小的东西binsavgs数组。

1 个答案:

答案 0 :(得分:11)

Numpy有一些非常强大的bin计数功能。

>>> binplace = np.digitize(avgs, bins) #Returns which bin an average belongs
>>> binplace
array([1, 6, 2, 3, 5, 4, 1, 4, 6, 6, 2, 3, 5, 6, 3, 1, 2, 3, 5, 7, 5, 3, 4])

>>> np.where(binplace == 1)
(array([ 0,  6, 15]),)
>>> np.where(binplace == 2)
(array([ 2, 10, 16]),)

>>> avgs[np.where(binplace == 1)]
array([ 11.02,  11.3 ,  11.01])