Numpy过滤器可以消除零区域

时间:2017-09-09 01:39:38

标签: python numpy convolution mathematical-morphology

我有一个0和更大的int numpy数组,其中值代表区域标签。例如,

array([[9, 9, 9, 0, 0, 0, 0, 1, 1, 1],
       [9, 9, 9, 9, 0, 7, 1, 1, 1, 1],
       [9, 9, 9, 9, 0, 2, 2, 1, 1, 1],
       [9, 9, 9, 8, 0, 2, 2, 1, 1, 1],
       [9, 9, 9, 8, 0, 2, 2, 2, 1, 1],
       [4, 4, 4, 4, 0, 2, 2, 2, 1, 1],
       [4, 6, 6, 4, 0, 0, 0, 0, 0, 0],
       [4, 6, 6, 4, 0, 0, 0, 0, 0, 0],
       [4, 4, 4, 4, 5, 5, 5, 5, 5, 5],
       [4, 4, 4, 4, 5, 5, 5, 5, 5, 5]])

我希望指数等于0(即零区域),以取其邻域中最常见的值。该操作基本上将关闭零区域。我尝试过多种扩张,侵蚀,grey-closing和其他morphology operations,但我不能完全消除零区域(没有笨拙地混合其他区域)。一个不错的方法可能是定义一个仅在零上进行卷积的内核,并使用过滤器区域中最常用的标签设置该值。我不确定如何实现这一点。

3 个答案:

答案 0 :(得分:1)

这里提出了一种矢量化方法。步骤是:

  1. 获取内核大小的2D滑动窗口,导致4D阵列。我们可以用 skimage's view_as_windows将这些作为视图,从而避免创建 任何额外的记忆。

  2. 通过索引到4D数组中选择以零为中心的窗口。这迫使副本。但假设零的数量比输入数组中的元素总数少,这应该没问题。

  3. 对于每个选定的窗口,使用适当的偏移量偏移每个窗口,并使用np.bincount执行计数。因此,使用bincount并获取不包括零的最大计数。最大计数的argmax应该是我们的家伙!

  4. 这是涵盖这些步骤的实施 -

    from skimage.util import view_as_windows as viewW
    
    def fill_zero_regions(a, kernel_size=3):
        hk = kernel_size//2 # half_kernel_size    
    
        a4D = viewW(a, (kernel_size,kernel_size))
        sliced_a = a[hk:-hk,hk:-hk]
        zeros_mask = sliced_a==0
        zero_neighs = a4D[zeros_mask].reshape(-1,kernel_size**2)
        n = len(zero_neighs) # num_zeros
    
        scale = zero_neighs.max()+1
        zno = zero_neighs + scale*np.arange(n)[:,None] # zero_neighs_offsetted
    
        count = np.bincount(zno.ravel(), minlength=n*scale).reshape(n,-1)
        modevals = count[:,1:].argmax(1)+1
        sliced_a[zeros_mask] = modevals
        return a
    

    示例运行 -

    In [23]: a
    Out[23]: 
    array([[9, 9, 9, 0, 0, 0, 0, 1, 1, 1],
           [9, 9, 9, 9, 0, 7, 1, 1, 1, 1],
           [9, 9, 9, 9, 0, 2, 2, 1, 1, 1],
           [9, 9, 9, 8, 0, 2, 2, 1, 1, 1],
           [9, 9, 9, 8, 0, 2, 2, 2, 1, 1],
           [4, 4, 4, 4, 0, 2, 2, 2, 1, 1],
           [4, 6, 6, 4, 0, 0, 0, 0, 0, 0],
           [4, 6, 6, 4, 0, 0, 0, 0, 0, 0],
           [4, 4, 4, 4, 5, 5, 5, 5, 5, 5],
           [4, 4, 4, 4, 5, 5, 5, 5, 5, 5]])
    
    In [24]: fill_zero_regions(a)
    Out[24]: 
    array([[9, 9, 9, 0, 0, 0, 0, 1, 1, 1],
           [9, 9, 9, 9, 9, 7, 1, 1, 1, 1],
           [9, 9, 9, 9, 2, 2, 2, 1, 1, 1],
           [9, 9, 9, 8, 2, 2, 2, 1, 1, 1],
           [9, 9, 9, 8, 2, 2, 2, 2, 1, 1],
           [4, 4, 4, 4, 2, 2, 2, 2, 1, 1],
           [4, 6, 6, 4, 4, 2, 2, 2, 1, 0],
           [4, 6, 6, 4, 4, 5, 5, 5, 5, 0],
           [4, 4, 4, 4, 5, 5, 5, 5, 5, 5],
           [4, 4, 4, 4, 5, 5, 5, 5, 5, 5]])
    

    如图所示,我们没有解决边界情况。如果需要,可以使用零填充数组作为输入数组,如下所示:np.pad(a, (k//2,k//2), 'constant'),其中k为内核大小(样本为=3)。

答案 1 :(得分:0)

基于卷积理念的可能解决方案

from scipy import stats
ar = #Your np array
blank = np.zeros(ar.shape)
#Size to search in for mode values
window_size = 3

for x,y in np.array(np.where(ar == 0)).T:
    window = ar[max(x-window_size,0):x+window_size,max(0,y-window_size):y+window_size]
    oneD = window.flatten()

    #fill blank array with modal value
    blank[x,y] = stats.mode(oneD[oneD != 0])[0]

#fill in the zeros
print ar + blank

我不确定这里是否可以避免循环

答案 2 :(得分:0)

这是一个使用Numba的工作解决方案,我还没有描述但应该很快:

import numba
@numba.njit
def nn(arr):
    res = arr.copy()
    zeros = np.where(arr == 0)
    for n in range(len(zeros[0])):
        i = zeros[0][n]
        j = zeros[1][n]
        left = max(i-1, 0)
        right = min(i+2, arr.shape[1])
        top = max(j-1, 0)
        bottom = min(j+2, arr.shape[0])
        area = arr[left:right,top:bottom].ravel()
        counts = np.bincount(area[area != 0])
        res[i,j] = np.argmax(counts)
    return res

它产生:

array([[9, 9, 9, 9, 7, 1, 1, 1, 1, 1],
       [9, 9, 9, 9, 9, 7, 1, 1, 1, 1],
       [9, 9, 9, 9, 2, 2, 2, 1, 1, 1],
       [9, 9, 9, 8, 2, 2, 2, 1, 1, 1],
       [9, 9, 9, 8, 2, 2, 2, 2, 1, 1],
       [4, 4, 4, 4, 2, 2, 2, 2, 1, 1],
       [4, 6, 6, 4, 4, 2, 2, 2, 1, 1],
       [4, 6, 6, 4, 4, 5, 5, 5, 5, 5],
       [4, 4, 4, 4, 5, 5, 5, 5, 5, 5],
       [4, 4, 4, 4, 5, 5, 5, 5, 5, 5]])

这里的内核大小为3x3,通过减去1并将{2}添加到ij来定义(添加2因为Python切片需要一个接一个,例如[0:3] ]给你3个元素)。边界条件由minmax处理。

归功于bincount的想法:https://stackoverflow.com/a/6252400/4323