我想知道如何在视觉中编码卷积TensorFlow模型,其中输入图像可能具有不同的分辨率。
一个廉价的解决办法是让所有人都使用Python PIL库将它们预先调整为足够大的分辨率,然后将其提供给TensorFlow。但我强烈怀疑有更好的方法来做到这一点。另一种更简单的方法可能是重复使用已经来自GPU的tf.image.crop_and_resize
。
我想到的另一种方法是使用TensorFlow变量名称范围并在每个图像上分别生成相同的模型batch_size
次以接受不同的输入分辨率,每个模型副本使用1的子批量大小。我想知道如果这样做,在计算时间和GPU内存大小的水平上是否会出现性能问题。
另一种方法是将图像填充到某些桶中,例如句子模型。
我还可以使用batch_size为1来训练,而不是所有这些模型的克隆,但这肯定会非常慢。
有关如何进行的任何想法?有关TensorFlow表现的任何事实可以帮助做出决定吗?任何现有的代码示例?非常感谢!