远程调试DataProc PySpark作业

时间:2017-07-10 11:54:41

标签: google-cloud-dataproc

有没有办法远程调试DataProc上的PySpark作业?

由于DataProc Spark在yarn集群中运行,它不会暴露tcp连接,所以例如如何通过IDE远程提交和调试作业?

- 更新:

通过PyCharm提交作业并访问SparkContext来调试作业代码。我看到这个guide用于java,但我不确定在DatProc上是否可以这样做。

0 个答案:

没有答案