TensorFlow:批量大小(CNN)的可变形状图像的动态尺寸

时间:2017-03-08 23:28:47

标签: performance tensorflow convolution

我想知道如何在视觉中编码卷积TensorFlow模型,其中输入图像可能具有不同的分辨率。

一个廉价的解决办法是让所有人都使用Python PIL库将它们预先调整为足够大的分辨率,然后将其提供给TensorFlow。但我强烈怀疑有更好的方法来做到这一点。另一种更简单的方法可能是重复使用已经来自GPU的tf.image.crop_and_resize

我想到的另一种方法是使用TensorFlow变量名称范围并在每个图像上分别生成相同的模型batch_size次以接受不同的输入分辨率,每个模型副本使用1的子批量大小。我想知道如果这样做,在计算时间和GPU内存大小的水平上是否会出现性能问题。

另一种方法是将图像填充到某些桶中,例如句子模型。

我还可以使用batch_size为1来训练,而不是所有这些模型的克隆,但这肯定会非常慢。

有关如何进行的任何想法?有关TensorFlow表现的任何事实可以帮助做出决定吗?任何现有的代码示例?非常感谢!

0 个答案:

没有答案