我正在尝试从Numpy数组表示的图像中删除行或列。我的图片类型为uint16和2560 x 2176.举个例子,假设我要删除前16列,使其成为2560 x 2160.
我是MATLAB-to-Numpy转换器,在MATLAB中会使用类似的东西:
A = rand(2560, 2196);
A(:, 1:16) = [];
据我了解,这会删除就地,并且不会复制到新数组,从而节省了大量时间。
对于Numpy,之前的帖子使用了numpy.delete
之类的命令。但是,文档很清楚,这会返回一个副本,所以我必须将副本重新分配给A.这似乎会浪费很多时间复制。
import numpy as np
A = np.random.rand(2560,2196)
A = np.delete(A, np.r_[:16], 1)
这真的和就地删除一样快吗?我觉得我必须错过一个更好的方法,或者不了解python在删除过程中如何处理数组存储。
以前的相关帖子:
Removing rows in NumPy efficiently
Documentation for numpy.delete
答案 0 :(得分:5)
为什么不做一片?在这里,我将删除前3000列而不是16列,以使内存使用更加清晰:
import numpy as np
a = np.empty((5000, 5000)
a = a[:, 3000:]
这有效地减少了内存中阵列的大小,可以看出:
In [31]: a = np.zeros((5000, 5000), dtype='d')
In [32]: whos
Variable Type Data/Info
-------------------------------
a ndarray 5000x5000: 25000000 elems, type `float64`, 200000000 bytes (190 Mb)
In [33]: a = a[:, 3000:]
In [34]: whos
Variable Type Data/Info
-------------------------------
a ndarray 5000x2000: 10000000 elems, type `float64`, 80000000 bytes (76 Mb)
对于此大小的数组,切片似乎比删除选项快10,000倍:
%timeit a=np.empty((5000,5000), dtype='d'); a=np.delete(a, np.r_[:3000], 1)
1 loops, best of 3: 404 ms per loop
%timeit a=np.empty((5000,5000), dtype='d'); a=a[:, 3000:]
10000 loops, best of 3: 39.3 us per loop