Question

我有一个我从文件中读取的图像(m,n,3)（即它有3个通道）。我还有一个矩阵来转换尺寸为(3,3)的颜色空间。我已经通过几种不同的方式将这个矩阵应用于图像中的每个向量;例如，

np.einsum('ij,...j',transform,image)

似乎与以下（更慢）实现的结果相同。

def convert(im: np.array, transform: np.array) -> np.array:
    """ Convert an image array to another colorspace """
    dimensions = len(im.shape)
    axes = im.shape[:dimensions-1]

    # Create a new array (respecting mutability)
    new_ = np.empty(im.shape)

    for coordinate in np.ndindex(axes):
        pixel            = im[coordinate]
        pixel_prime      = transform @ pixel
        new_[coordinate] = pixel_prime

    return new_

但是，我发现在使用line_profiler对示例图像进行测试时，以下效率更高。

np.moveaxis(np.tensordot(transform, X, axes=((-1),(-1))), 0, 2)

我在这里遇到的问题是使用一个np.tensordot，即不需要np.moveaxis。我花了几个小时试图找到一个解决方案（我猜它在于选择正确的axes），所以我想我会请别人帮忙。

Answer 1

如果您将2 2 3 2 3 3 4 2 4 3 4 4作为第一个参数，则可以使用tensordot简洁地完成此操作：

image

通过使用参数np.tensordot(image, transform, axes=(-1, 1))（需要numpy 1.12或更高版本），您可以从einsum获得更好的性能：

optimize=True

或者（正如Paul Panzer在评论中指出的那样），你可以简单地使用矩阵乘法：

np.einsum('ij,...j', transform, image, optimize=True)

它们几乎同时在我的电脑上播放。

使用numpy.tensordot更改颜色空间

1 个答案: