计算不同长度的三维数组的平均值

时间:2013-02-20 11:23:48

标签: python numpy scipy

我有一个尺寸为n * d * m的三维数组。但是,ni可以变化。它看起来像这样

[[[1,1,3],  [[3,2,1],  [[4,3,2],  
  [3,4,2]],  [3,4,2],   [5,2,3]]]
             [4,5,3]],

我需要计算所有数据点的平均值。我正在使用scipy.stats.mean函数,但是引发了有关不匹配维度的错误。因此,我正在考虑将数组填充到最大的ni,以便它具有像这样的统一尺寸

[[[  1,  1,  3],  [[3,2,1],  [[  4,  3,  2],  
  [  3,  4,  2],   [3,4,2],   [  5,  2,  3],
  [NaN,NaN,NaN]],  [4,5,3]],  [NaN,NaN,NaN]]] 

但我不知道这是否是最佳解决方案或我如何用NaN计算平均值。

有什么建议吗?

3 个答案:

答案 0 :(得分:2)

您可以使用masked arrays

>>> from numpy import ma, nan
>>> a = ma.array([[1,1,3], [3,4,2], [nan,nan,nan]], mask=[[0,0,0],[0,0,0],[1,1,1]])
>>> b = ma.array([[3,2,1], [3,4,2], [4,5,3]])
>>> c = ma.array([[4,3,2], [5,2,3], [nan,nan,nan]], mask=[[0,0,0],[0,0,0],[1,1,1]])
>>> X = ma.array([a, b, c])

然后在任意轴上取平均值将忽略蒙版值:

>>> X.mean(axis=0)
masked_array(data =
 [[2.66666666667 2.0 2.0]
 [3.66666666667 3.33333333333 2.33333333333]
 [4.0 5.0 3.0]],
             mask =
 [[False False False]
 [False False False]
 [False False False]],
       fill_value = 1e+20)

>>> X.mean(axis=1)
masked_array(data =
 [[2.0 2.5 2.5]
 [3.33333333333 3.66666666667 2.0]
 [4.5 2.5 2.5]],
             mask =
 [[False False False]
 [False False False]
 [False False False]],
       fill_value = 1e+20)

>>> X.mean(axis=2)
masked_array(data =
 [[1.66666666667 3.0 --]
 [2.0 3.0 4.0]
 [3.0 3.33333333333 --]],
             mask =
 [[False False  True]
 [False False False]
 [False False  True]],
       fill_value = 1e+20)

答案 1 :(得分:0)

假设你的数组实际上是[[[1,1,3],[3,4,2]],[[3,2,1],[3,4,2],[4,5,3]],[[4,3,2],[5,2,3]]],你应该提到你有一个三维数组,那么可以使用循环找到平均数:

>>> l = [[[1,1,3],[3,4,2]],[[3,2,1],[3,4,2],[4,5,3]],[[4,3,2],[5,2,3]]]
>>> s = 0; n=0;

>>> for i in l:    #First loop traverses through the first dimension
        for j in i:    #Traverses through the second dimension
            s += sum(j)
            n += len(j)


>>> print("Average is ", s/n)
Average is  2.85714

答案 2 :(得分:0)

看起来所有numpy数组函数都失败了,因为你的对象是2D数组的列表,而不是3D numpy数组。

解决方案是展开列表并单独计算均值。在你的情况下,这将是:

In [23]: import numpy as np

In [24]: L = np.array([[[1,1,3],[3,4,2]],
                  [[3,2,1],[3,4,2],[4,5,3]],[[4,3,2],[5,2,3]]])

In [28]: Lsum = ( np.sum(L[0]) + np.sum(L[1]) + np.sum(L[2]) ) 

In [29]: Lmean = Lsum.astype(float) \ 
                   / ( np.size(L[0]) + np.size(L[1]) + np.size(L[2]) )

In [46]: Lmean
Out[46]: 2.8571428571428572

这可以放入循环中以改变第三维......