分布式张量流无法并置节点/ job:master / task:0'和'/ job:ps / task:0'

时间:2018-07-22 22:07:01

标签: python tensorflow keras tensorflow-estimator

我正在尝试使用tf.keras模型和estimators api设置分布式tensorflow。我遇到了问题:

  

InvalidArgumentError(请参阅上面的回溯):无法并置节点   “解码器字嵌入/嵌入”和   '培训/那达姆/渐变/解码器-词嵌入/ GatherV2_grad /形状:   无法合并具有不兼容作业的设备:'/ job:master / task:0'和   '/职位:p       s / task:0'
          节点:解码器-词嵌入/嵌入= VariableV2_class = [“ loc:@ Decoder-词-嵌入/嵌入”],   container =“”,dtype = DT_FLOAT,shape = [4259,300],shared_name =“”,   _device =“ / job:ps / task:0”]]

这是我正在运行的TF_CONFIG

  

{“集群”:{“主机”:[“本地主机:22222”],“ ps”:[“本地主机:22223”],“工人”:[“本地主机:22224”]},“任务”: {“ type”:“ worker”,“ index”:0},“ model_dir”:“ / data / models /”}

此处正在运行代码:https://github.com/inc0/github_issue/blob/master/train.py

0 个答案:

没有答案