如何在tensorflow中使用`tf.train.string_input_prodecer()`加载不同的图像?

时间:2017-03-19 09:53:56

标签: tensorflow

我得到的图像集中包含不同大小和扩展名的图像。它们的大部分色彩空间都是RGB,而有些则获得额外的alpha通道。

如何在tensorflow中将它们转换为227 * 227 * 3(3表示RGB)? 非常感谢!

1 个答案:

答案 0 :(得分:0)

查看Image APIs

特别是,你感兴趣的可能是Cropping标题中的以下函数:

tf.image.resize_image_with_crop_or_pad
tf.image.central_crop
tf.image.pad_to_bounding_box
tf.image.crop_to_bounding_box
tf.image.extract_glimpse
tf.image.crop_and_resize

对于Alpha通道,它实际上取决于您在图像中的阅读方式。如果您使用的是tf.image.decode_image,您可以尝试指定channels=3/4(我不确定这是否会破坏代码)但如果它与您提到的一样,则有些图片有alpha而有些图片没有,那么你可能想使用cv2或PIL来完全预处理图像并将它们裁剪为227x227x3。