如果有人可以回答我或指导我的文章来理解它们,我会有一些疑问。 我研究了不同的预训练模型,即AlexNet,VGG,GoogLeNet,InceptionV3和ResNet。
(大小为AlexNet:207.266MB,VGG:407.981MB,GoogLeNet:22MB,ResNet:155MB)
Q1)在GoogLeNet和InceptionV3的所有规模中,规模较小吗? 可能是什么原因?使用初始模型还是使用1x1卷积滤波器?
Q2)为什么AlexNet的大小大于GoogLeNet和ResNet?是因为计算了每一层的梯度吗?
另一个问题与理解MATLAB提供的培训进度有关?为什么模型在最初的时代挣扎?有哪些可能的选择?
如果您能帮助我找到这些问题的答案,我将不胜感激?