我正在尝试训练深度神经网络,该网络使用来自两个单独图像的信息,以获得类似于this的最终图像输出。不同之处在于我的两个输入图像没有任何空间关系,因为它们是具有不同信息量的完全不同的图像。如何使用这种输入使用双流CNN或任何其他架构?
供参考:一张图片尺寸(5184x3456),另一张图片尺寸(640x240)。
答案 0 :(得分:0)
首先:你有两张图片并不重要。当您将一个图像作为输入时,单个图像可以具有不同的大小时,您会遇到完全相同的问题。
有多种策略可以解决这个问题:
在您选择的框架中寻找“合并层”或“连接层”: