我在Keras上构建了Mobilenet。在本地运行它的每一步大约需要290秒,但是当我在GCLoud ML Engine上运行时,它需要花费400秒以上。我在代码中添加了以下行:
K.tensorflow_backend._get_available_gpus()
日志如下:
['/job:localhost/replica:0/task:0/device:GPU:0']
我也尝试将1个GPU更改为4个GPU,但结果是相同的。我是否需要更改任何代码以在GPU上优化Keras?