通过最近的"种子"对Python数组进行分类区域?

时间:2015-08-06 06:30:07

标签: python arrays numpy scipy image-segmentation

我有一个生态栖息地的栅格,我已经转换成二维Python numpy数组(下面的example_array)。我还有一个包含"种子"具有唯一值的区域(下面的seed_array),我想用它来对我的栖息地区域进行分类。我想'成长'我的种子区域进入'我的栖息地区域为栖息地分配了最近种子区域的ID,如通过'通过'栖息地区。例如:

Image of arrays

我最好的方法是使用ndimage.distance_transform_edt函数创建一个数组,描述最近的"种子"数据集中每个单元格的区域,然后被替换回栖息地阵列。然而,这并不是特别好用,因为该功能不能测量距离"通过"我的栖息地区域,例如下面红圈代表错误分类的单元格:

Incorrect output using ndimage

下面是我的栖​​息地和种子数据的示例数组,以及我正在寻找的输出类型的示例。我的实际数据集要大得多 - 超过一百万个栖息地/种子区域。任何帮助将不胜感激!

import numpy as np
import scipy.ndimage as ndimage
import matplotlib.pyplot as plt

# Sample study area array
example_array = np.array([[0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0],
                          [0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1],
                          [0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1],
                          [0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0],
                          [1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1],
                          [1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1],
                          [1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1],
                          [1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0],
                          [1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0],
                          [1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0],
                          [1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0],
                          [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]])

# Plot example array
plt.imshow(example_array, cmap="spectral", interpolation='nearest')

seed_array = np.array([[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                       [0, 0, 0, 0, 4, 0, 0, 0, 0, 0, 0, 0],
                       [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 0],
                       [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                       [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                       [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                       [0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                       [0, 1, 1, 1, 0, 0, 2, 2, 0, 0, 0, 0],
                       [0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0],
                       [0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0],
                       [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                       [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]])

# Plot seeds
plt.imshow(seed_array, cmap="spectral", interpolation='nearest')

desired_output = np.array([[0, 0, 0, 0, 4, 0, 0, 0, 0, 0, 0, 0],
                           [0, 0, 0, 4, 4, 4, 0, 0, 0, 3, 3, 3],
                           [0, 0, 0, 0, 4, 4, 0, 0, 0, 3, 3, 3],
                           [0, 0, 0, 0, 0, 0, 0, 0, 3, 0, 3, 0],
                           [1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 3, 3],
                           [1, 1, 0, 1, 0, 0, 0, 0, 2, 2, 3, 3],
                           [1, 1, 1, 1, 0, 0, 2, 2, 2, 0, 0, 3],
                           [1, 1, 1, 1, 1, 2, 2, 2, 2, 0, 0, 0],
                           [1, 1, 1, 1, 0, 0, 2, 2, 2, 0, 0, 0],
                           [1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0],
                           [1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0],
                           [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]])

# Plot desired output
plt.imshow(desired_output, cmap="spectral", interpolation='nearest')

1 个答案:

答案 0 :(得分:13)

您可以使用scikits-image中的watershed segmentation

  • 距离变换

    from scipy import ndimage as nd
    distance = nd.distance_transform_edt(example_array)
    
  • 分水岭分段

    from skimage.morphology import watershed, square
    result = watershed(-distance, seed_array, mask=example_array, \
                       connectivity=square(3))
    
  • 结果

    subplot(1,2,1)
    imshow(-distance, 'spectral', interpolation='none')
    subplot(1,2,2)
    imshow(result, 'spectral', interpolation='none')
    

enter image description here

作为另一种变体,并且在您的初始方法之后,您可以使用分水岭找到最近种子的连接邻居。正如你在问题中提到的那样:

  • 计算与种子的距离:

    distance = nd.distance_transform_edt(seed_array == 0)
    
  • 计算距离空间中的分水岭:

    result = watershed(distance, seed_array, mask=example_array, \
                       connectivity=square(3))
    
  • 情节结果:

    figure(figsize=(9,3))
    subplot(1,3,1)
    imshow(distance, 'jet', interpolation='none')
    subplot(1,3,2)
    imshow(np.ma.masked_where(example_array==0, distance), 'jet', interpolation='none')
    subplot(1,3,3)
    imshow(result, 'spectral', interpolation='none')
    

enter image description here

进一步讨论:分水岭方法尝试通过流动通过图像渐变来增加种子峰的区域。由于您的图像是二进制的,因此区域将从种子点的所有方向均匀扩展,从而为您提供两个区域之间的点。有关分水岭的更多信息,请参阅wikipedia

在第一个例子中,距离变换是在原始图像中计算的,因此这些区域从种子中均匀扩展,直到它们在中间达到分裂点。

在第二个示例中,距离变换是从所有像素到任何种子点计算的,然后在该空间中应用分水岭。 Watershed基本上会将每个像素分配给最近的种子,但它会增加连接约束。

注意绘图和水域中距离图的符号差异。

注意在距离地图中(两个地块中的左图),蓝色表示关闭,其中红色表示远。