分布式Tensorflow:工作人员未响应

时间:2018-11-04 03:36:25

标签: tensorflow

我正在AWS实例上运行Tensorflow Distributed模式。 PS在一台计算机上,每个工作人员在另一台计算机上。我正在运行以下问题:

Item::Item (string name, string description): Entity(name, description) {
}

我发现有人已经发布了与我现在面临的问题完全相同的问题,但是他的答案对我来说还不清楚,Tensorflow distributed: CreateSession still waiting for response from worker: /job:ps/replica:0/task:0

有人可以建议解决方案吗?

1 个答案:

答案 0 :(得分:0)

现在,在解决错误之后,我将分享我的解决方案。这不是TF代码中的错误,而是我尝试解决上述问题的两件事之一。因为我正在处理EC2实例,所以防火墙阻止了节点之间的连接。因此,我制定了规则,接受到实例的所有流量。其次,我在命令行中仅使用IP-address:port-No。相反,我是这样写的,ec2-IP.compute-1.amazonaws.com:2222。

相关问题