标签: machine-learning conv-neural-network object-detection
无论空间位置和/或旋转(甚至可能变形?),网络都应该将狗的图像学习为狗。我的问题是CNN如何实现这一目标?输入图像上的卷积操作成功检测到特定标签特征的特征,但在分类结束时,我们有一个FC层,对于图像中的狗的一个位置,将接收不同的输入集,而对于另一个位置,输入会有所不同。准确地说 - 对于图像中物体的不同空间位置,FC层的不同神经元将被激活,那么网络如何能够检测到不同位置的狗的存在?