我有图像分割项目,地面实况标签作为图像给出,其中像素值代表标签。我需要调整图像和标签的大小,同时将标签保持在相同的值集中。
让我们创建虚拟数据
from skimage.transform import rescale, resize
from scipy import ndimage
from PIL import Image
import cv2
mask = np.zeros((30,20), dtype=np.uint16)
mask[22:26,12:30]=70
mask[25:27,14:17]=30
print('original label', mask.shape, np.unique(mask))
输出:原始标签形状:(30,20)原始标签值: [0 30 70]
我需要调整标签大小,因此结果只有0,30,70个值。
我尝试了什么skimage_resized = resize(mask, (mask.shape[0]//2, mask.shape[1]//2), mode='constant')
print(skimage_resized.shape, np.unique(mask_resized))
skimage_rescale = rescale(mask, 1.0/2.0, mode='constant')
print(skimage_rescale.shape, np.unique(mask_resized))
ndimage_resized = ndimage.interpolation.zoom(mask, 0.5)
print(ndimage_resized.shape, np.unique(mask_resized))
cv2_resized = cv2.resize(mask, (mask.shape[0]//2, mask.shape[1]//2),
interpolation=cv2.INTER_NEAREST)
print(cv2_resized.shape, np.unique(mask_resized))
mask_pil = Image.fromarray(mask, mode=None)
pil_resized = mask_pil.thumbnail((mask.shape[0]//2, mask.shape[1]//2), Image.NEAREST)
print(skimage_resized.shape, np.unique(pil_resized))
输出:
(15, 10) [ 0 5 6 28 29 30 31 61 62 65 70 71 74 75 76]
(15, 10) [ 0 5 6 28 29 30 31 61 62 65 70 71 74 75 76]
(15, 10) [ 0 5 6 28 29 30 31 61 62 65 70 71 74 75 76]
(10, 15) [ 0 5 6 28 29 30 31 61 62 65 70 71 74 75 76]
(15, 10) [None]
答案 0 :(得分:1)
使用openCV找到解决方案。
import numpy as np
import cv2
resizeto = 2
small_lable = cv2.resize(mask, (mask.shape[1]//resizeto,
mask.shape[0]//resizeto),
interpolation=cv2.INTER_NEAREST)
small_lable = (np.array(small_lable)).astype('uint8')
print(small_lable.shape, np.unique(small_lable))
plt.imshow(small_lable)
输出:
(15, 10) [ 0 30 70]
答案 1 :(得分:0)
来自docs(强调我的):
请注意,在对图像进行下采样时,调整大小和重新缩放应执行高斯平滑以避免混叠伪像。请参阅这些函数的anti_aliasing和anti_aliasing_sigma参数。
缩小版用于通过整数因子对n维图像进行下采样,使用局部均值对作为函数参数给出的每个块的元素进行下行采样。
问题的一种可能解决方法是通过basic slicing进行下采样:
import numpy as np
dx, dy = 2, 2
mask = np.zeros((30, 20), dtype=np.uint16)
mask[22:26, 12:30] = 70
mask[25:27, 14:17] = 30
downsampled = mask[::dx, ::dy]
print(downsampled.shape, np.unique(downsampled))
上面代码段的输出是:
(15, 10) [ 0 30 70]