标签: neural-network deep-learning caffe conv-neural-network
我想训练一个转换神经网络来检测图像的正确方向。只有4度(0,90,180和270)。
困难在于:图像将包含不同的对象 - 单人,人群,山景,建筑物等......
我正在考虑在大量图像上训练convNet。每个图像将旋转4次(0,90,180和270)。并且每个图像将具有标签(0-> 0,90-> 1,180-> 2,270-> 3)。
是否还有其他可以用作灵感的方向convNets /复杂4级convNets / RNN的例子? (我正在使用Caffe框架)
谢谢!
答案 0 :(得分:0)
一个非常有趣的问题。 我同意你的观察,即在照片中查看特定物体并使用它们的方向来决定图像方向可能会产生误导。 例如,检查此图像:
它是完美的导向,但脸不直。
因此,我认为您将此问题视为图像标注问题(即每个输入图像的单个方向标签)的方法是一种很好的方法。 我会采用任何不太现实的现成网,并根据您建议的标签对其进行微调。