Python中平均两行而忽略NaN

时间:2012-09-11 04:18:59

标签: python arrays numpy average mean

我有一个二维数据数组。我需要平均每两行,并返回平均值的一半高度的数组。我还需要忽略所有NaN值以进行平均。例如:

>>> x = numpy.array([[ 1,  nan,  3,  4,  5],
... [ 6,  7,  8,  9, nan],
... [11, 12, 13, 14, nan],
... [16, nan, 18, 19, nan]])

该功能需要返回:

>>> x
array([[3.5,  7,  5.5,  6.5,  5],
[13.5, 12, 15.5, 16.5, nan]])

1 个答案:

答案 0 :(得分:3)

这应该可以解决问题:

numpy.ma.average(numpy.ma.masked_invalid(x).reshape(-1, 2, x.shape[-1]), 1)

对我而言,它会返回

masked_array(data =
 [[3.5 7.0 5.5 6.5 5.0]
 [13.5 12.0 15.5 16.5 --]],
             mask =
 [[False False False False False]
 [False False False False  True]],
       fill_value = 1e+20)