Question

我得到的图像集中包含不同大小和扩展名的图像。它们的大部分色彩空间都是RGB，而有些则获得额外的alpha通道。

如何在tensorflow中将它们转换为227 * 227 * 3（3表示RGB）？非常感谢！

Answer 1

特别是，你感兴趣的可能是Cropping标题中的以下函数：

tf.image.resize_image_with_crop_or_pad
tf.image.central_crop
tf.image.pad_to_bounding_box
tf.image.crop_to_bounding_box
tf.image.extract_glimpse
tf.image.crop_and_resize

对于Alpha通道，它实际上取决于您在图像中的阅读方式。如果您使用的是tf.image.decode_image，您可以尝试指定channels=3/4（我不确定这是否会破坏代码）但如果它与您提到的一样，则有些图片有alpha而有些图片没有，那么你可能想使用cv2或PIL来完全预处理图像并将它们裁剪为227x227x3。

如何在tensorflow中使用`tf.train.string_input_prodecer（）`加载不同的图像？

1 个答案: