我正在尝试可视化来自Torchvision模块的VGG19网络中间层的输出,特别是conv4_2
层。
我已将输出提取为形状为[1, 512, 50, 50]
的张量。
但是如何可视化具有512通道的图像?
答案 0 :(得分:1)
功能可视化是一个非常复杂的主题。
如果您想直观地了解训练网络的每个过滤器(在512个中)的响应,可以使用类似these的方法:将梯度从conv4_2
的输出传播到输入图像,然后更改图像以最大化特征响应。您将需要通过正则化等方式来获得平滑的视觉效果。
或者,您可以看到每个过滤器(512个过滤器中)对每个位置(重叠的接收字段)的特定响应。在这种情况下,您有512个不同的50×50强度图像,每个图像显示每个神经元对输入图像的响应图。