标签: python pyspark pycharm jupyter-notebook cloudera
我是大数据开发的初学者,现在我在共享环境中使用Cloudera服务,我正在使用Jupyter笔记本构建用于数据摄取的spark脚本,但我不确定这是否是一个好方法,因为我想念IDE资源,如代码完成,自动导入,调试器等。 最近我测试了pycharm尝试构建一些脚本,但我无法将其配置为使用远程资源。 他们怎么建议?我已经用Jupyter构建了一些脚本,但我认为使用其他方法我可以提高效率。