现代CNN(卷积神经网络)作为DetectNet旋转不变吗?

时间:2016-12-03 20:27:17

标签: machine-learning computer-vision neural-network deep-learning conv-neural-network

众所周知nVidia DetectNet - 用于物体检测的CNN(卷积神经网络)基于Yolo / DenseBox的方法:https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/

  

DetectNet是流行的GoogLeNet网络的扩展。该   扩展类似于 Yolo和DenseBox 中采用的方法   论文。

如图所示,DetectNet可以检测任何轮换的对象(汽车):https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/

enter image description here

现代CNN(卷积神经网络)是否像DetectNet一样旋转不变?

我可以使用相同的物体旋转角度在数千张不同的图像上训练DetectNet,以检测任何旋转角度的物体吗?

enter image description here

那么旋转不变量:Yolo,Yolo v2,基于DetectNet的DenseBox?

2 个答案:

答案 0 :(得分:5)

没有

CNN不是旋转不变的。您需要在训练集中包含每个可能的旋转图像。

您可以训练CNN将图像分类为预定义的类别(如果您想要检测图像中的多个对象,则需要使用分类器扫描图像的每个位置)。

CNN对训练数据中的小水平或垂直移动不变。

答案 1 :(得分:2)

再加上Rob的回答,一般来说CNN本身就是翻译不变,但不是旋转和缩放。但是,并非强制要求将所有可能的轮换都包含在训练数据中。最大池层将引入旋转不变量。

Franck Dernoncourt This image发布的{p> here可能是您正在寻找的内容。

其次,关于Kershaw对Rob的答案的评论说:

  

CNN对训练数据中的小水平或垂直运动不变,主要是因为最大池化。

CNN转换不变的主要原因是卷积。无论图像在图像中的哪个位置,滤镜都会提取特征,因为滤镜将在整个图像中移动。当图像旋转或缩放时,由于特征的像素表示不同,滤镜会失败。

来源:Aditya Kumar Praharaj来自this link的答案。