标签: tensorflow
我成功地获得了一个简单的集群,每个集群都有一个:主,参数服务器,工作者,评估者。我按照tf.estimator.train_and_evaluate页面上的说明进行操作,并通过将train_spec.max_steps设置为20000来设置停止条件。我的问题是这足以阻止主管和工作人员,但参数服务器和评估者继续等待环。由于我在批处理调度程序下运行并要求一定的时间限制,所以我必须等到那时才能获得输出。在完成所有培训后,有没有办法通知参数服务器和评估者退出?