我所拥有的系统是我从模型中读取的,该模型在3-4个独立的过程中连续生成预测。
这是用于强化学习的视频游戏,因此我无法处理数据的工人/队列
然后我想将操作/奖励发送给中心流程,以便在其更新权重后进行学习,所有其他流程也将需要更新权重。
我看过 https://www.tensorflow.org/deploy/distributed https://clusterone.com/blog/2017/09/13/distributed-tensorflow-clusterone/
在分布式机器上进行培训的大多数示例正好相反。
如何设置任务工作者,使他们正在运行的任务只是一个预测步骤,而不是训练步骤?
train_step = (
tf.train.AdamOptimizer(learning_rate)
.minimize(loss, global_step=global_step)
)
在我的情况下,除非我可以从其中获取数据,否则将无法正常工作。
每个进程都是在我的控件外部创建的,因此tensorflow无法创建进程。
类似于此问题: How to run several Keras neural networks in parallel
但是这个问题没有答案,它基于我的张量流中的thaneos。
也与此类似: Running Keras model for prediction in multiple threads
但是我是在单独的进程中而不是线程