给出输入图像,预测由于某种矩阵变换而改变的输出图像。
重要的部分是网络以前从未见过的输入图像,能够像对图像进行矩阵转换一样对输入图像执行相同的矩阵转换。
我曾经尝试过使用自动编码器,但是发现它非常适合。网络本质上是学习输入和输出像素之间的映射,而不是学习将输入变成输出的变换。
此任务识别矩阵变换的最佳方法是什么?
答案 0 :(得分:1)
这听起来像是一项既可以完成的任务(您想从示例中学习线性翘曲),又可以完成神经网络的冗余。神经网络(尤其是深度变化的神经网络)可用于建模转换,这些转换的功能形式是先验未知,高度非线性,非常复杂并且从输入空间的一部分到另一部分发生了显着变化。这些条件似乎都不适用于您指出的问题。
预测线性变形的难点不是变形本身,而是发现哪些输出图像点对应于哪些输入图像点。当实现这一点时,估计扭曲本身就是线性最小二乘的简单应用。
点对应问题可能会非常复杂-想象将现在的伦敦航拍照片与1900年在地面拍摄的照片相匹配-很难用功能或基于规则的形式表示。 / p>