标签: python tensorflow machine-learning distributed
我使用4台CPU机器训练了模型。为了恢复它,我需要在每台机器上保存模型吗?如何从主节点上的每个CPU获取保存状态以便可以恢复? 目前,如果我尝试恢复我面临的模型错误
tensorflow.python.framework.errors_impl.NotFoundError:不成功 TensorSliceReader构造函数:无法找到任何匹配的文件 ./newsvr.ckpt