众所周知nVidia DetectNet - 用于物体检测的CNN(卷积神经网络)基于Yolo / DenseBox的方法:https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/
DetectNet是流行的GoogLeNet网络的扩展。该 扩展类似于 Yolo和DenseBox 中采用的方法 论文。
如图所示,DetectNet可以检测任何轮换的对象(汽车):https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/
现代CNN(卷积神经网络)是否像DetectNet一样旋转不变?
我可以使用相同的物体旋转角度在数千张不同的图像上训练DetectNet,以检测任何旋转角度的物体吗?
那么旋转不变量:Yolo,Yolo v2,基于DetectNet的DenseBox?
答案 0 :(得分:5)
没有
CNN不是旋转不变的。您需要在训练集中包含每个可能的旋转图像。
您可以训练CNN将图像分类为预定义的类别(如果您想要检测图像中的多个对象,则需要使用分类器扫描图像的每个位置)。
CNN对训练数据中的小水平或垂直移动不变。
答案 1 :(得分:2)
再加上Rob的回答,一般来说CNN本身就是翻译不变,但不是旋转和缩放。但是,并非强制要求将所有可能的轮换都包含在训练数据中。最大池层将引入旋转不变量。
Franck Dernoncourt This image发布的{p> here可能是您正在寻找的内容。其次,关于Kershaw对Rob的答案的评论说:
CNN对训练数据中的小水平或垂直运动不变,主要是因为最大池化。
CNN转换不变的主要原因是卷积。无论图像在图像中的哪个位置,滤镜都会提取特征,因为滤镜将在整个图像中移动。当图像旋转或缩放时,由于特征的像素表示不同,滤镜会失败。
来源:Aditya Kumar Praharaj来自this link的答案。