Dataproc PySpark Streaming作业无法连接到资源管理器

时间:2017-05-18 08:29:36

标签: pyspark spark-streaming google-cloud-dataproc

我在Google Cloud Dataproc群集上的PySpark流媒体作业在初始阶段失败,称连接到资源管理器并失败。

相同的代码在我的本地主机上成功运行。

错误讯息:

  

INFO org.apache.hadoop.yarn.client.RMProxy:正在连接到   clustername / Job输出的ResourceManager已完成

在此作业中,检查点文件和jars位于master上,以便按照Dennis here

的建议启用从检查点目录恢复一次

0 个答案:

没有答案