对于大多数模型,为了使用3个GPU,我可以在进行训练时设置--num_clones=3 --ps_tasks=1
。但是,对于某些模型,这不起作用。还有其他参数,例如worker_replicas, num_ps_tasks, num_replicas
。
有人可以解释一下这些参数背后的含义,并举例说明如何设置它们以使用具有N个GPU的单台计算机吗?
通过我要运行的模型的方式是ssd_resnet50_v1_fpn_shared_box_predictor_640x640_coco14_sync.config