应用错误收集

时间：2016-12-03 20:27:17

标签： machine-learning computer-vision neural-network deep-learning conv-neural-network

众所周知nVidia DetectNet - 用于物体检测的CNN（卷积神经网络）基于Yolo / DenseBox的方法：https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/

DetectNet是流行的GoogLeNet网络的扩展。该扩展类似于 Yolo和DenseBox 中采用的方法论文。

现代CNN（卷积神经网络）是否像DetectNet一样旋转不变？

我可以使用相同的物体旋转角度在数千张不同的图像上训练DetectNet，以检测任何旋转角度的物体吗？

那么旋转不变量：Yolo，Yolo v2，基于DetectNet的DenseBox？

答案 0 :(得分：5)

没有

CNN不是旋转不变的。您需要在训练集中包含每个可能的旋转图像。

您可以训练CNN将图像分类为预定义的类别（如果您想要检测图像中的多个对象，则需要使用分类器扫描图像的每个位置）。

CNN对训练数据中的小水平或垂直移动不变。

答案 1 :(得分：2)

再加上Rob的回答，一般来说CNN本身就是翻译不变，但不是旋转和缩放。但是，并非强制要求将所有可能的轮换都包含在训练数据中。最大池层将引入旋转不变量。

Franck Dernoncourt This image发布的{p> here可能是您正在寻找的内容。

其次，关于Kershaw对Rob的答案的评论说：

CNN对训练数据中的小水平或垂直运动不变，主要是因为最大池化。

CNN转换不变的主要原因是卷积。无论图像在图像中的哪个位置，滤镜都会提取特征，因为滤镜将在整个图像中移动。当图像旋转或缩放时，由于特征的像素表示不同，滤镜会失败。

来源：Aditya Kumar Praharaj来自this link的答案。