我有resnet50网络,其顶层包括形状为(1,2048)的全局平均池和使用形状为(1,3)的softmax的密集层。对于密集层的输出,全局平均池化层中(1,2048)的输出形状如何变为(1,3)?它是如何工作的?我找不到可靠的资料来解释
答案 0 :(得分:0)
致密或完全连接层只是矩阵乘法(与偏压)。所以,你做的是乘法与形状的矩阵1x2048
与形状的另一个矩阵2048x3
获得形状的输出矩阵1x3
,让你的分数为您3班。 Softmax将这些分数转换为概率。当然网络学习使用反向传播这些矩阵的权重。