我正在尝试使用tf-slim库来使用多台没有GPU的机器来训练Inception V3。
我正在按照此处给出的教程:https://github.com/tensorflow/models/tree/master/slim。我可以使用一台仅有CPU的机器进行培训,但我正在试图找出如何使用多台机器进行培训。它在页面中提到:
此过程可能需要几天时间,具体取决于您的硬件设置。 为方便起见,我们提供了一种在多个GPU上训练模型的方法, 和/或多个CPU,同步或异步。看到 model_deploy了解详情。
我无法弄清楚如何使用model_deploy来训练使用多台机器,我也无法找到任何示例。
如何使用model_deploy来训练使用多台机器?
提前致谢!