应用错误收集

如果有人可以回答我或指导我的文章来理解它们，我会有一些疑问。我研究了不同的预训练模型，即AlexNet，VGG，GoogLeNet，InceptionV3和ResNet。

（大小为AlexNet：207.266MB，VGG：407.981MB，GoogLeNet：22MB，ResNet：155MB）

Q1）在GoogLeNet和InceptionV3的所有规模中，规模较小吗？可能是什么原因？使用初始模型还是使用1x1卷积滤波器？

Q2）为什么AlexNet的大小大于GoogLeNet和ResNet？是因为计算了每一层的梯度吗？

另一个问题与理解MATLAB提供的培训进度有关？为什么模型在最初的时代挣扎？有哪些可能的选择？

如果您能帮助我找到这些问题的答案，我将不胜感激？