使用 Google Colab TPU,在 Imagenet 上训练 VGG-16型号需要多长时间?
我很好奇,使用谷歌 CoLab TPU 在 ImageNet 上培训 VGG16模型需要多长时间?如果有人能给我解释一下他们为得到答案所做的计算,那就太好了。
tensorflow
推荐答案
很难准确估计训练一只 e2e 模型需要多长时间。但假设您只是在寻找一个非常粗略的估计,我们可以从注意到我们拥有的这个 ResNet50实现(代码)在 v2-8 TPU 设备上在大约7.3小时内运行到收敛(76%+90个历元上训练的 top1准确率)。鉴于 VGG16在步长时间上足够接近(https://github . com/JC Johnson/CNN-benchmarks # CNN-benchmarks ),我希望它的收敛也与此成比例。但是,声明这是一个非常粗略的估计,实际性能还取决于实现的优化程度