标签: google-cloud-dataproc
有没有办法远程调试DataProc上的PySpark作业?
由于DataProc Spark在yarn集群中运行,它不会暴露tcp连接,所以例如如何通过IDE远程提交和调试作业?
- 更新:
通过PyCharm提交作业并访问SparkContext来调试作业代码。我看到这个guide用于java,但我不确定在DatProc上是否可以这样做。