使用Python在2d数组(图像)中的像素邻居

时间:2012-06-12 12:34:48

标签: python numpy computer-vision scipy nearest-neighbor

我有一个像这样的numpy数组:

x = np.array([[1,2,3],[4,5,6],[7,8,9]])

我需要创建一个函数,让我们用以下输入参数称它为“邻居”:

  • x:numpy 2d数组
  • (i,j):二维数组中元素的索引
  • d:邻域半径

作为输出,我希望获得具有给定距离i,j的单元d的邻居。 所以如果我跑

neighbors(im, i, j, d=1) with i = 1 and j = 1 (element value = 5) 

我应该得到以下值的索引:[1,2,3,4,6,7,8,9]。我希望我说清楚。 是否有像scipy这样的图书馆处理这个?

我已经做了一些工作,但这是一个粗略的解决方案。

def pixel_neighbours(self, p):

    rows, cols = self.im.shape

    i, j = p[0], p[1]

    rmin = i - 1 if i - 1 >= 0 else 0
    rmax = i + 1 if i + 1 < rows else i

    cmin = j - 1 if j - 1 >= 0 else 0
    cmax = j + 1 if j + 1 < cols else j

    neighbours = []

    for x in xrange(rmin, rmax + 1):
        for y in xrange(cmin, cmax + 1):
            neighbours.append([x, y])
    neighbours.remove([p[0], p[1]])

    return neighbours

我该如何改善这个?

7 个答案:

答案 0 :(得分:22)

查看scipy.ndimage.generic_filter.

举个例子:

import numpy as np
import scipy.ndimage as ndimage

def test_func(values):
    print values
    return values.sum()


x = np.array([[1,2,3],[4,5,6],[7,8,9]])

footprint = np.array([[1,1,1],
                      [1,0,1],
                      [1,1,1]])

results = ndimage.generic_filter(x, test_func, footprint=footprint)

默认情况下,它会“反映”边界处的值。您可以使用mode关键字参数来控制它。

但是,如果您想要做这样的事情,那么您很有可能将问题表达为某种卷积。如果是这样的话,将其分解为卷积步骤并使用更优化的函数(例如大多数scipy.ndimage)会快得多。

答案 1 :(得分:6)

编辑:啊废话,我的回答只是写im[i-d:i+d+1, j-d:j+d+1].flatten(),但写得难以理解:)


好的旧滑动窗口技巧可能会有所帮助:

import numpy as np
from numpy.lib.stride_tricks import as_strided

def sliding_window(arr, window_size):
    """ Construct a sliding window view of the array"""
    arr = np.asarray(arr)
    window_size = int(window_size)
    if arr.ndim != 2:
        raise ValueError("need 2-D input")
    if not (window_size > 0):
        raise ValueError("need a positive window size")
    shape = (arr.shape[0] - window_size + 1,
             arr.shape[1] - window_size + 1,
             window_size, window_size)
    if shape[0] <= 0:
        shape = (1, shape[1], arr.shape[0], shape[3])
    if shape[1] <= 0:
        shape = (shape[0], 1, shape[2], arr.shape[1])
    strides = (arr.shape[1]*arr.itemsize, arr.itemsize,
               arr.shape[1]*arr.itemsize, arr.itemsize)
    return as_strided(arr, shape=shape, strides=strides)

def cell_neighbors(arr, i, j, d):
    """Return d-th neighbors of cell (i, j)"""
    w = sliding_window(arr, 2*d+1)

    ix = np.clip(i - d, 0, w.shape[0]-1)
    jx = np.clip(j - d, 0, w.shape[1]-1)

    i0 = max(0, i - d - ix)
    j0 = max(0, j - d - jx)
    i1 = w.shape[2] - max(0, d - i + ix)
    j1 = w.shape[3] - max(0, d - j + jx)

    return w[ix, jx][i0:i1,j0:j1].ravel()

x = np.arange(8*8).reshape(8, 8)
print x

for d in [1, 2]:
    for p in [(0,0), (0,1), (6,6), (8,8)]:
        print "-- d=%d, %r" % (d, p)
        print cell_neighbors(x, p[0], p[1], d=d)

这里没有做任何时间,但这个版本可能有合理的性能。

有关详细信息,请使用短语“滚动窗口numpy”或“滑动窗口numpy”搜索网络。

答案 2 :(得分:3)

我不知道任何库函数,但你可以使用numpy的强大切片功能轻松编写类似的东西:

import numpy as np
def neighbors(im, i, j, d=1):
    n = im[i-d:i+d+1, j-d:j+d+1].flatten()
    # remove the element (i,j)
    n = np.hstack((b[:len(b)//2],b[len(b)//2+1:] ))
    return n

当然,您应该进行一些范围检查以避免越界访问。

答案 3 :(得分:2)

通过使用maxmin,您可以处理上下边界的像素:

im[max(i-1,0):min(i+2,i_end), max(j-1,0):min(j+2,j_end)].flatten()

答案 4 :(得分:1)

我同意Joe Kingtons的回应,只是增加了足迹

import numpy as np
from scipy.ndimage import generate_binary_structure
from scipy.ndimage import iterate_structure
foot = np.array(generate_binary_structure(2, 1),dtype=int)

或更大/不同的脚印,例如

np.array(iterate_structure(foot , 2),dtype=int)

答案 5 :(得分:0)

可能在KDTree中使用SciPy吗?

答案 6 :(得分:-1)

我们首先使用numpy初始化感兴趣的矩阵

import numpy as np

x = np.array([[1,2,3],[4,5,6],[7,8,9]])

print(x)

[[1 2 3]
 [4 5 6]
 [7 8 9]]

我们的邻居是距离的函数,例如,我们可能对距离2的邻居感兴趣,这告诉我们应该如何填充矩阵x。我们选择用零填充,但您可以用任何您想要的填充,模式,行/列中位数

填充
d = 2

x_padded = np.pad(x,d,mode='constant')

print(x_padded)

[[0 0 0 0 0 0 0]
 [0 0 0 0 0 0 0]
 [0 0 1 2 3 0 0]
 [0 0 4 5 6 0 0]
 [0 0 7 8 9 0 0]
 [0 0 0 0 0 0 0]
 [0 0 0 0 0 0 0]]

我们使用x_padded矩阵来获取矩阵x中任何值的邻居。 令(i,j)(s,t)分别为xx_padded的索引。现在我们需要将(i,j)转换为(s,t)以获得(i,j)的邻居

i,j = 2,1
s,t = 2*d+i+1, 2*d+j+1

window = x_padded[i:s, j:t]

print(window)

[[0 1 2 3 0]
 [0 4 5 6 0]
 [0 7 8 9 0]
 [0 0 0 0 0]
 [0 0 0 0 0]]

请注意!!!索引(i,j)指向您希望在矩阵x 中获得其邻居的任何值

可能希望遍历矩阵x中的每个点,得到其邻居 并在图像处理中使用邻居进行计算,例如与内核的卷积。可能需要执行以下操作来获取图像x

中每个像素的邻居
for i in range(x.shape[0]):
    for j in range(x.shape[1]):
        i,j = 2,1
        s,t = 2*d+i+1, 2*d+j+1
        window = x_padded[i:s, j:t]