有效地删除numpy图像数组的行/列

时间:2012-12-29 04:55:18

标签: python image matlab image-processing numpy

我正在尝试从Numpy数组表示的图像中删除行或列。我的图片类型为uint16和2560 x 2176.举个例子,假设我要删除前16列,使其成为2560 x 2160.

我是MATLAB-to-Numpy转换器,在MATLAB中会使用类似的东西:

A = rand(2560, 2196);
A(:, 1:16) = [];

据我了解,这会删除就地,并且不会复制到新数组,从而节省了大量时间。

对于Numpy,之前的帖子使用了numpy.delete之类的命令。但是,文档很清楚,这会返回一个副本,所以我必须将副本重新分配给A.这似乎会浪费很多时间复制。

import numpy as np

A = np.random.rand(2560,2196)
A = np.delete(A, np.r_[:16], 1)

这真的和就地删除一样快吗?我觉得我必须错过一个更好的方法,或者不了解python在删除过程中如何处理数组存储。

以前的相关帖子:
Removing rows in NumPy efficiently
Documentation for numpy.delete

1 个答案:

答案 0 :(得分:5)

为什么不做一片?在这里,我将删除前3000列而不是16列,以使内存使用更加清晰:

import numpy as np
a = np.empty((5000, 5000)
a = a[:, 3000:]

这有效地减少了内存中阵列的大小,可以看出:

In [31]: a = np.zeros((5000, 5000), dtype='d')
In [32]: whos
Variable   Type       Data/Info
-------------------------------
a          ndarray    5000x5000: 25000000 elems, type `float64`, 200000000 bytes (190 Mb)
In [33]: a = a[:, 3000:]
In [34]: whos
Variable   Type       Data/Info
-------------------------------
a          ndarray    5000x2000: 10000000 elems, type `float64`, 80000000 bytes (76 Mb)

对于此大小的数组,切片似乎比删除选项快10,000倍:

%timeit a=np.empty((5000,5000), dtype='d');  a=np.delete(a, np.r_[:3000], 1)
1 loops, best of 3: 404 ms per loop
%timeit a=np.empty((5000,5000), dtype='d');  a=a[:, 3000:]
10000 loops, best of 3: 39.3 us per loop