我正在学习tensorflow r1.3,我想知道发送/接收过程机器到机器和设备到设备。
据我所知,Rendezvous类与设备发送/接收张量设备有关。那么还有其他类与发送/接收张量机器相关吗?我认为Rendezvous在设备上工作(比如..task:0 / gpu:0 ..)所以它可以在机器之间发送/接收进程的角色,但我不确定。
我想在tensorflow源代码中专门检查它,但很难弄明白。如果我能知道具体来源(文件),请告诉我。
感谢。
答案 0 :(得分:0)
分布式TensorFlow实现位于TensorFlow存储库的tensorflow/core/distributed_runtime
目录中。它包含RpcRemoteRendezvous
类,它是Rendezvous
接口的一个实现,它使用RPC从不同的机器中检索张量值。
TensorFlow Architecture指南详细介绍了TensorFlow图如何在机器之间拆分,并且张量在它们之间流动。