Numpy直方图,如何取每个bin中的最大值

时间:2012-05-25 08:16:22

标签: python numpy histogram

我有一系列数字,我用上面的代码。是否可以返回每个箱子中的最大数量?

看一下示例代码:

  from numpy import *


  a=array([1,4,5,6,7.8,9,3.4,5.,6,3.5,6,8,9,10])

  bins=arange(0,11,1)

  h=hist(a,bins=bins)

  h=hist(a,bins=bins,weights=a)

这就是它的回归

  (array([  0. ,   1. ,   0. ,   6.9,   4. ,  10. ,  18. ,   7.8,   8. ,  28. ]), array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

我想知道是否有可能获得3.5(这是3到4之间的最大数字)而不是第4个bin中的6.9。

2 个答案:

答案 0 :(得分:1)

这将为您提供bin中每个元素的最大值,如果bin中没有元素,则为0

print [max(a[(a>=(i))&(a<i+1)]) if a[(a>=(i))&(a<i+1)].size else 0 for i in bins]
[0, 1.0, 0, 3.5, 4.0, 5.0, 6.0, 7.7999999999999998, 8.0, 9.0, 10.0]

+1更改为您的容器大小,以使其有用。

答案 1 :(得分:1)

您可以使用numpy.digitize。请注意,它使用0标记小于第一个bin的值。

a[np.digitize(a,bins) == 4].max()

蒙面数组在这里很有用:

import numpy.ma as ma
a2 = ma.empty((len(bins),len(a)))
a2.data[...] = a
a2.mask = np.digitize(a,bins)-1 != bins[:,np.newaxis]
a2.max(axis=1).filled(np.nan)

array([  nan,   1. ,   nan,   3.5,   4. ,   5. ,   6. ,   7.8,   8. ,
         9. ,  10. ])