在进程之间共享张量流模型

时间:2016-09-14 21:40:08

标签: tensorflow ipc

我在服务器上运行了几个进程,其中一个进程是在tensorflow中训练模型。我希望培训师定期将当前模型发送到其他流程。我现在这样做的方法是使用通常的Saver类,它可以从磁盘saverestore

但是,我认为这种形式的IPC效率很低,并且可能导致服务器上的文件系统锁定。如果有一种方法可以将变量序列化为某个blob,我可以通过zmq广播管道发送它,但我还没有在文档中找到它。

或者,分布式张量流可能取决于任务,但我认为我不需要这么复杂的东西。

1 个答案:

答案 0 :(得分:2)

您可以预先分享架构,然后在您喜欢的每个步骤中使用tf.get_collection(tf.GraphKeys.VARIABLES),并运行它以获取值,然后您可以在另一端使用variable.assign来加载值在适当的变量中。