用于GLCM计算和窗口大小的Mahotas库

时间:2017-03-06 11:41:01

标签: python computer-vision scikit-image mahotas glcm

我正在使用mahotas库在卫星图像(250 x 200像素)上进行纹理分析(GLCM)。 GLCM计算在窗口大小内执行。因此,对于滑动窗口的两个相邻位置,我们需要从头开始计算两个共生矩阵。我已经读过我也可以设置步长,以避免在重叠区域上计算GLCM。我已经提供了以下代码。

#Compute haralick features
def haralick_feature(image):
    haralick = mahotas.features.haralick(image, True)
    return haralick


img = 'SAR_image.tif'
win_s=32 #window size
step=32 #step size

rows = img.shape[0]
cols = img.shape[1]
array = np.zeros((rows,cols), dtype= object)
harList = []

for i in range(0, rows-win_s-1, step):
        print 'Row number: ', r
    for j in range(0, cols-win_s-1, step):
        harList.append(haralick_feature(image))

harImages = np.array(harList)     
harImages_mean = harImages.mean(axis=1)

对于上面的代码,我已经将窗口和步长设置为32.当代码完成时,我得到一个尺寸为6 x 8(而不是250 x 200)的图像,这是有意义的,因为步长已经设置为32。

所以,我的问题是:通过设置步长(以避免重叠区域中的计算以及代码变得更快),我可以以某种方式导出尺寸为250 x 200而不是具有子集的整个图像的GLCM结果它(6 x 8维)?或者我没有选择,只能用正常的方式循环图像(没有设置步长)?

1 个答案:

答案 0 :(得分:1)

您无法使用mahotas执行此操作,因为此库中无法使用计算共现地图的功能。从GLCM中提取纹理特征的另一种方法是使用skimage.feature.graycoprops(详情请查看this thread)。

但是如果你想坚持mahotas,你应该尝试使用skimage.util.view_as_windows而不是滑动窗口,因为它可以加快扫描图像。请务必阅读文档末尾有关内存用法的警告。如果使用view_as_windows是一种经济实惠的方法,则以下代码可以完成工作:

import numpy as np
from skimage import io, util
import mahotas.features.texture as mht

def haralick_features(img, win, d):
    win_sz = 2*win + 1
    window_shape = (win_sz, win_sz)
    arr = np.pad(img, win, mode='reflect')
    windows = util.view_as_windows(arr, window_shape)
    Nd = len(d)
    feats = np.zeros(shape=windows.shape[:2] + (Nd, 4, 13), dtype=np.float64)
    for m in xrange(windows.shape[0]):
        for n in xrange(windows.shape[1]):
            for i, di in enumerate(d):
                w = windows[m, n, :, :]
                feats[m, n, i, :, :] = mht.haralick(w, distance=di)
    return feats.reshape(feats.shape[:2] + (-1,))

<强>样本

对于下面的示例运行,我将win设置为19,这对应于形状(39, 39)的窗口。我考虑了两种不同的距离。请注意,mht.haralick为四个方向产生了13个GLCM功能。总而言之,这导致每个像素的104维特征向量。当应用于Landsat图像中的(250, 200)像素裁剪时,特征提取将在大约7分钟内完成。

In [171]: img = io.imread('landsat_crop.tif')

In [172]: img.shape
Out[172]: (250L, 200L)

In [173]: win = 19

In [174]: d = (1, 2)

In [175]: %time feature_map = haralick_features(img, win, d)
Wall time: 7min 4s

In [176]: feature_map.shape
Out[176]: (250L, 200L, 104L)

In [177]: feature_map[0, 0, :]
Out[177]: 
array([  8.19278030e-03,   1.30863698e+01,   7.64234582e-01, ...,
         3.59561817e+00,  -1.35383606e-01,   8.32570045e-01])

In [178]: io.imshow(img)
Out[178]: <matplotlib.image.AxesImage at 0xc5a9b38>

Landsat image