快速方法基于另一个数组重新着色索引图像

时间:2017-01-27 14:31:38

标签: python performance numpy vectorization

我有一个由多个区域组成的索引图像bins0是背景,其他正值是一个区域。

我想根据另一个数组填写每个区域的值,例如:

bins = # image of shape (height, width), type int
ids = np.array([1, 5, ... ]) # region ids
values = np.array([0.1, ...]) # Values for each region, same shape as ids
img = np.empty(bins.shape, 'float32')
img[:] = np.nan
for i, val in zip(ids, values):
    img[bins == i + 1] = val

但是这个循环在python中非常慢。有没有办法以一种漂亮的numpy方式编写它?

提前致谢!

1 个答案:

答案 0 :(得分:2)

这是一种方法 -

out = np.take(values, np.searchsorted(ids, bins-1))
out.ravel()[~np.in1d(bins,ids+1)] = np.nan

请注意,这假设要对ids进行排序。如果情况并非如此,我们需要将可选参数sorternp.searchsorted一起使用。

这是另一个有着非常相似想法的人,但作为使用初始化的小调整,并限制仅在有效元素上使用np.searchsorted -

out = np.full(bins.shape, np.nan)
mask = np.in1d(bins,ids+1)
out.ravel()[mask] = np.take(values, np.searchsorted(ids+1, bins.ravel()[mask]))