如果在python

时间:2015-10-20 01:53:16

标签: python arrays numpy mask

我正在尝试使用屏蔽数组运行(嵌套条件)程序。我使用相同的功能没有蒙版数组,工作正常。该函数如下所示:

import numpy as np
x = np.random.rand(100)
x = x.reshape(4,25)
x = np.ma.masked_less(x,0.2) 
y = np.random.rand(100)
y = y.reshape(4,25)
y = np.ma.masked_less(y,0.2)
z = np.zeros_like(x)

#say that both arrays are masked in the same positions.

for i in range(len(x)):
    for j in range(len(y)):
        if x[i,j] >= y[i,j]:
            if (x[i,j]-y[i,j]) > (z[i,j-1]):
               z[i,j] = 0.
            else:
               z[i,j] = 1.
        else:
            z[i,j] = z[i,j-1] - (x[i,j]-y[i,j])

我希望得到一个具有相同特征(也就是掩码)输入数据(在这种情况下为x,y)的数组。但是,我得到的结果是,或者是一个完全屏蔽的数组,或者一个没有掩码的值,如下所示:

z = 
masked_array(data =
[[-- -- -- ..., -- -- --]
[-- -- -- ..., -- -- --]
[-- -- -- ..., -- -- --]
..., 
[-- -- -- ..., -- -- --]
[-- -- -- ..., -- -- --]
[-- -- -- ..., -- -- --]],
         mask =
[[ True  True  True ...,  True  True  True]
[ True  True  True ...,  True  True  True]
[ True  True  True ...,  True  True  True]
..., 
[ True  True  True ...,  True  True  True]
[ True  True  True ...,  True  True  True]
[ True  True  True ...,  True  True  True]],
   fill_value = 9.96920996839e+36)

z = 
masked_array(data =
[[9.0 9.0 9.0 ..., 9.0 9.0 9.0]
[9.0 9.0 9.0 ..., 9.0 9.0 9.0]
[9.0 9.0 9.0 ..., 9.0 9.0 9.0]
..., 
[9.0 9.0 9.0 ..., 9.0 9.0 9.0]
[9.0 9.0 9.0 ..., 9.0 9.0 9.0]
[9.0 9.0 9.0 ..., 9.0 9.0 9.0]],
         mask =
[[False False False ..., False False False]
[False False False ..., False False False]
[False False False ..., False False False]
..., 
[False False False ..., False False False]
[False False False ..., False False False]
[False False False ..., False False False]],
   fill_value = 9.96920996839e+36)

实际上我想要这样的东西:

z = 
masked_array(data =
[[9.0 -- -- ..., -- -- --]
[8.7 -- -- ..., -- -- --]
[-- -- -- ..., -- -- --]
..., 
[1.0 -- -- ..., -- -- --]
[-- 3.6 -- ..., -- -- --]
[-- -- -- ..., -- -- --]],
         mask =
[[ False  True  True ...,  True  True  True]
[ False  True  True ...,  True  True  True]
[ True  True  True ...,  True  True  True]
..., 
[ False  True  True ...,  True  True  True]
[ True  False  True ...,  True  True  True]
[ True  True  True ...,  True  True  True]],
   fill_value = 9.96920996839e+36)

我已经阅读了有关屏蔽数组的可用信息,以及类似的问题,但没有一个对此有令人满意的解释。我想知道条件语句是否有可能以类似于numpy的方式工作。在某种意义上它们只显示这些条件的索引?

3 个答案:

答案 0 :(得分:2)

还有另一种方法可以进行计算,而不需要屏蔽数组。 如果需要,您仍然可以在最后屏蔽z数组。

    x = np.random.rand(100)
    x = x.reshape(4,25)
    y = np.random.rand(100)
    y = y.reshape(4,25)

    # first if- first if
    idxs_1 = ( x >= y) & ((x-y) > (z-1)) 
    z[idxs_1] = 0

    # second if-else
    idxs_2 = (x>=y) & ((x-y) <= z-1)
    z[idxs_2] = 1

    # final else
    idxs_3 = x < y 
    idxs_3_p = np.hstack((idxs_3[:, 1:], idxs_3[:,0][:,None])) # reshape so that we shift z by one column left        

    z[idxs_3] = z[idxs_3_p] - (x[idxs_3] - y[idxs_3])

您需要仔细检查某些测试数据的布尔索引的正确性。

答案 1 :(得分:1)

  1. 第二个if语句中可能存在拼写错误。它应该是

    for i in range(len(x)):
        for j in range(len(y)):
            if x[i,j] >= y[i,j]:
                if (x[i,j]-y[i,j]) > (z[i,j-1]): # not x - y[i,j], but x[i,j]-y[i,j] ??
                    # and further down 
    
  2. 在我的计算机上,它实际上可以工作并产生预期的结果,即掩盖的数组与屏蔽/未屏蔽的混合在一起:

     In [2]: z
     Out[2]: 
     masked_array(data =
      [[0.34864202355178786 1.0 1.0 1.6118423555903627 -- 0.0 0.0 0.0 0.0 0.0 0.0
       0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0]
      [0.32457641778594915 1.0 1.0 -- -- 0.0 -- 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
       0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0]
      [-- 1.0 1.541983077540757 1.0 0.0 0.0 -- 0.0 0.0 0.0 -- 0.0 0.0 -- 0.0 0.0
       0.0 0.0 0.0 0.0 0.0 -- 0.0 0.0 --]
      [-- -- 1.0 -- 0.0 0.0 0.0 0.0 0.0 -- 0.0 -- 0.0 0.0 0.0 -- 0.0 -- 0.0 --
       -- 0.0 0.0 0.0 0.0]],
                  mask =
      [[False False False False  True False False False False False False False
       False False False False False False False False False False False False
       False]
      [False False False  True  True False  True False False False False False
       False False False False False False False False False False False False
       False]
      [ True False False False False False  True False False False  True False
       False  True False False False False False False False  True False False
        True]
      [ True  True False  True False False False False False  True False  True
       False False False  True False  True False  True  True False False False
       False]],
            fill_value = 1e+20)
    

答案 2 :(得分:0)

我通过使用&#39;外部&#39;解决了我的问题。环。我的意思是我在核心函数中只使用了一个循环而不是2或3,这取决于我的数据(1D到3D数组),即

def func(x,y):
    import numpy as np
    x = np.random.rand(100)
    x = x.reshape(4,25)
    x = np.ma.masked_less(x,0.2) 
    y = np.random.rand(100)
    y = y.reshape(4,25)
    y = np.ma.masked_less(y,0.2)
    z = np.zeros_like(x)

#say that both arrays are masked in the same positions.

    for i in range(len(x)):
        z[i] =  x[i] >= y[i]:
            if (x[i]-y[i]) > (z[i-1]):
               z[i] = 0.
            else:
               z[i] = 1.
        else:
            z[i] = z[i-1] - (x[i]-y[i])

return z

然后,如果我有一个3D数组netCDF文件,我将我的函数应用为:

func = np.zeros_like(x)
for i in range(len(x)):
    for j in range(len(y)):
        func[i,j] = func(x[i,j],x[i,j])

请注意,使用numpy.where也是一个不错的选择。但是,由于我在python(以及一般编程)方面的短暂经验,我没有利用numpy机制来向我的函数进行矢量化。现在,我的功能似乎按照我的预期工作。