我正在尝试使用tf.keras模型和estimators api设置分布式tensorflow。我遇到了问题:
InvalidArgumentError(请参阅上面的回溯):无法并置节点 “解码器字嵌入/嵌入”和 '培训/那达姆/渐变/解码器-词嵌入/ GatherV2_grad /形状: 无法合并具有不兼容作业的设备:'/ job:master / task:0'和 '/职位:p s / task:0'
节点:解码器-词嵌入/嵌入= VariableV2_class = [“ loc:@ Decoder-词-嵌入/嵌入”], container =“”,dtype = DT_FLOAT,shape = [4259,300],shared_name =“”, _device =“ / job:ps / task:0”]]
这是我正在运行的TF_CONFIG
{“集群”:{“主机”:[“本地主机:22222”],“ ps”:[“本地主机:22223”],“工人”:[“本地主机:22224”]},“任务”: {“ type”:“ worker”,“ index”:0},“ model_dir”:“ / data / models /”}
此处正在运行代码:https://github.com/inc0/github_issue/blob/master/train.py