Question

我有一个大小为N * M的矩阵，我想找到每一行的平均值。值为1到5，没有任何值的条目设置为0.但是，当我想使用以下方法查找平均值时，它给出了错误的含义，因为它还计算具有值的条目0

matrix_row_mean= matrix.mean(axis=1)

如何才能得到非零值的平均值？

Answer 1

获取每行中的非零数，并使用它来平均每行的总和。因此，实现看起来像这样 -

np.true_divide(matrix.sum(1),(matrix!=0).sum(1))

如果您使用的是较早版本的NumPy，则可以使用计数的浮点转换来替换np.true_divide，就像这样 -

matrix.sum(1)/(matrix!=0).sum(1).astype(float)

示例运行 -

In [160]: matrix
Out[160]: 
array([[0, 0, 1, 0, 2],
       [1, 0, 0, 2, 0],
       [0, 1, 1, 0, 0],
       [0, 2, 2, 2, 2]])

In [161]: np.true_divide(matrix.sum(1),(matrix!=0).sum(1))
Out[161]: array([ 1.5,  1.5,  1. ,  2. ])

解决问题的另一种方法是用NaNs替换零，然后使用np.nanmean，这将忽略那些NaNs并实际上忽略原始zeros，如所以 -

np.nanmean(np.where(matrix!=0,matrix,np.nan),1)

从性能的角度来看，我建议采用第一种方法。

Answer 2

我将在此详细介绍使用masked array的更一般的解决方案。为了说明细节，让我们创建一个只有一个的下三角矩阵：

matrix = np.tril(np.ones((5, 5)), 0)

如果您上面的术语不清楚，则此矩阵如下所示：

  [[ 1.,  0.,  0.,  0.,  0.],
   [ 1.,  1.,  0.,  0.,  0.],
   [ 1.,  1.,  1.,  0.,  0.],
   [ 1.,  1.,  1.,  1.,  0.],
   [ 1.,  1.,  1.,  1.,  1.]]

现在，我们希望我们的函数为每行返回平均值1。或者换句话说，轴1上的平均值等于五个矢量。为了实现这一目标，我们创建了一个蒙版矩阵，其中值为零的条目被视为无效。这可以通过np.ma.masked_equal：

来实现

masked = np.ma.masked_equal(matrix, 0)

最后，我们在这个数组中执行numpy操作，系统地忽略被屏蔽的元素（0）。考虑到这一点，我们通过以下方式获得了所需的结果：

masked.mean(axis=1)

这应该产生一个矢量，其条目只有一个。

更详细地说，np.ma.masked_equal(matrix, 0)的输出应如下所示：

masked_array(data =
 [[1.0 -- -- -- --]
 [1.0 1.0 -- -- --]
 [1.0 1.0 1.0 -- --]
 [1.0 1.0 1.0 1.0 --]
 [1.0 1.0 1.0 1.0 1.0]],
             mask =
 [[False  True  True  True  True]
 [False False  True  True  True]
 [False False False  True  True]
 [False False False False  True]
 [False False False False False]],
       fill_value = 0.0)

这表示--上的eh值被视为无效。这也在掩码数组的掩码属性中显示为True ，表示IT是无效元素，因此应该被忽略。

最后，这个数组上的平均运算的输出应该是：

masked_array(data = [1.0 1.0 1.0 1.0 1.0],
             mask = [False False False False False],
       fill_value = 1e+20)

Numpy意味着非零值

2 个答案: