标签: pyspark spark-streaming google-cloud-dataproc
我在Google Cloud Dataproc群集上的PySpark流媒体作业在初始阶段失败,称连接到资源管理器并失败。
相同的代码在我的本地主机上成功运行。
错误讯息:
INFO org.apache.hadoop.yarn.client.RMProxy:正在连接到 clustername / Job输出的ResourceManager已完成
在此作业中,检查点文件和jars位于master上,以便按照Dennis here