有关ML和DL的所有文章均引入了梯度下降法,或者采用逐步方法来最大程度地降低总体损失函数。我以为我理解了这个话题,但是在遇到梯度上升时,我认为我需要进一步澄清。
对于复杂的神经网络程序包(例如Keras),可以利用梯度上升可视化网络中的每个covnet过滤器,其中我们最大化了损失函数(在这种情况下,其对应于图像中过滤器的激活-我也不太确定他们如何将其指定给网络)以生成使该过滤器最大化的输入图像。
因此,相反,使用梯度下降法会为您提供空白图像,而该过滤器没有任何形状特征吗?
在训练CNN识别图像方面,covnet过滤器与梯度下降有何关系?我们正在误删哪些错误?
谢谢