我想知道CNN的基本架构是否具有旋转等效性?我只知道平移等效但不确定旋转。
从我的搜索中,可以通过旋转输入图像进行训练来实现旋转等效。我真的需要这样做吗?旋转度有多大?为了放置更多的上下文,例如,我有一个可以在横向模式下检测/读取文本的CNN。如果我将图像旋转90度/使其成像,它会得到与原始图像相同的结果/执行相同的结果吗?
答案 0 :(得分:2)
你只有一定程度的尺度和旋转不变性 - 究竟可能取决于你的设置多少。您拥有它,因为包含这些功能的池可能会重叠。
你的建议当然是可能的。您可以随时修改训练数据,添加噪音,旋转,不同比例等,以实现该目标。但是,您的模型仍然不会完全旋转不变。也可以修改网络本身以“正确”完成任务。我确信你在研究期间偶然发现了Tiled CNNs(如果没有,你一定要读那篇论文)。他们使用TICA进行预训练,在此过程中找到不变的特征。
关于旋转90°的最后一个问题:我建议你自己测试一下。如果发生旋转的情况是已知的(例如在移动设备上),我个人会看到手动将图片旋转回0°(在将其提供给网络之前)是否是给定约束的令人满意的解决方案。这是最简单的方法。