应用错误收集

使用GOOGLE COLAB TPU在IMAGENET上训练VGG-16模型需要多长时间？

时间：2019-10-27 19:42:27

标签： tensorflow deep-learning google-colaboratory tpu google-cloud-tpu

很好奇，使用GOOGLE COLAB TPU在IMAGENET上训练VGG16模型需要多长时间？如果有人可以向我解释他们为获得答案所做的计算，那将是很棒的！

2 个答案:

答案 0 :(得分：2)

这是官方的TPU example。在具有 2990 个训练图像的优化 tfrecord 数据集上训练 VGG-16，IMAGE_SIZE = [331, 331], batch_size=128, 12 epochs 需要 2 分钟 15 秒。我认为 1,281,167 ImageNet images 的训练需要 approximately 15 hours。

答案 1 :(得分：1)

很难准确估计训练模型e2e所需的时间。但是假设您只是在寻找一个非常粗略的估计，我们可以从注意到我们拥有的{code）这个ResNet50实现开始，在大约7.3个小时内达到收敛（76％+ top1精度在90个时元上训练）在v2-8 TPU设备上。鉴于VGG16在步进时间（https://github.com/jcjohnson/cnn-benchmarks#cnn-benchmarks）中足够接近，我希望它的收敛性也与之成正比。但是，免责声明这是一个非常粗略的估计，实际性能还取决于实现的优化程度。