标签: python tensorflow amazon-ec2 keras
我正在训练图像分类模型,我在带有8个GPU的AWS p2实例上使用Keras和tensorflow后端。我已经在multi_gpu模型中配置了培训。以下是我的参数。
multi_gpu
- batch_size 256 - epoch 30 - steps_per_epoch 10000
我的训练数据集是300万张图像,理想情况下,此设置将花费多少时间来训练模型。我也想提供一些经历过类似情况的意见或反馈。
当前一个纪元大约需要28个小时。