python - tf.train.MonitoredTrainingSession（）是否支持GRPC？

tf.train.MonitoredTrainingSession（）是否支持GRPC？

时间：2017-03-29 20:42:42

标签： python session tensorflow distributed grpc

我们需要使用＆＃34; Between-graph Replication＆＃34;定义多个客户端（每个客户端创建和构建Tensorflow会话/图表）。在分布式Tensorflow中。通常，客户端和工作人员处于同一个进程中，tf.train.MonitoredTrainingSession()协调这些Tensorflow会话。

现在，如果每个客户端和工作人员不在同一个进程中，并且我希望客户端使用grpc远程驱动工作人员任务，我想知道tf.train.MonitoredTrainingSession()或某些API是否支持此功能，或者是否有人有任何其他解决方案或想法。（我知道tf.Session(<grpc_url>)支持grpc，但它不协调多个Tensorflow会话）

1 个答案:

答案 0 :(得分：1)

是的，tf.train.MonitoredTrainingSession可以使用gRPC。但是，您必须手动创建tf.train.Server对象（通常每个进程一个），如Distributed TensorFlow tutorial所示。

创建tf.train.Server后，为分布式培训配置tf.train.MonitoredTrainingSession的最常用方法是调用tf.train.MonitoredTrainingSession(master=server.target)，其中server是其中一个服务器"worker"工作。