我有一个我从文件中读取的图像(m,n,3)
(即它有3个通道)。我还有一个矩阵来转换尺寸为(3,3)
的颜色空间。我已经通过几种不同的方式将这个矩阵应用于图像中的每个向量;例如,
np.einsum('ij,...j',transform,image)
似乎与以下(更慢)实现的结果相同。
def convert(im: np.array, transform: np.array) -> np.array:
""" Convert an image array to another colorspace """
dimensions = len(im.shape)
axes = im.shape[:dimensions-1]
# Create a new array (respecting mutability)
new_ = np.empty(im.shape)
for coordinate in np.ndindex(axes):
pixel = im[coordinate]
pixel_prime = transform @ pixel
new_[coordinate] = pixel_prime
return new_
但是,我发现在使用line_profiler对示例图像进行测试时,以下效率更高。
np.moveaxis(np.tensordot(transform, X, axes=((-1),(-1))), 0, 2)
我在这里遇到的问题是使用 一个np.tensordot
,即不需要np.moveaxis
。我花了几个小时试图找到一个解决方案(我猜它在于选择正确的axes
),所以我想我会请别人帮忙。
答案 0 :(得分:2)
如果您将2 2
3 2
3 3
4 2
4 3
4 4
作为第一个参数,则可以使用tensordot
简洁地完成此操作:
image
通过使用参数np.tensordot(image, transform, axes=(-1, 1))
(需要numpy 1.12或更高版本),您可以从einsum
获得更好的性能:
optimize=True
或者(正如Paul Panzer在评论中指出的那样),你可以简单地使用矩阵乘法:
np.einsum('ij,...j', transform, image, optimize=True)
它们几乎同时在我的电脑上播放。