当我启动集群时,在TaskManager中登录如下:
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试1,超时:500 毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试2,超时: 1000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试3,超时: 2000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试4,超时: 8000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试5,超时: 16000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试6,超时: 30000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试7,超时: 30000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试8,超时: 30000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试9,超时: 30000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 试图在JobManager注册 akka.tcp:// flink @ master1:6123 / user / jobmanager(尝试10,超时: 30000毫秒)
似乎无法与JobManger联系,Bu web Ui可以看到TaskManager。 当我向集群提交作业时,JobManager会收到一些错误日志:
引起的 :akka.pattern.AskTimeoutException:收件人[演员[阿卡://弗林克/ deadLetters]] 已被终止
我猜akka有些错误,但我不知道如何解决它。 非常感谢帮助我
答案 0 :(得分:1)
最后,我自己解决了这个问题。 flink 1.3.x中存在一个错误,您的群集主机不得包含特殊字符。
在我的生产环境中,主机名为“flink_master”“slaves_01”“slaves_02”。 “_”导致了这个问题。您似乎只允许使用字母数字和数字字符。当我将主机更改为“master”“salves1”“slaves2”时,它运行良好。