我刚开始学习火花并且一直在使用R&我公司的Jupyter笔记本上的Python。
所有spark和Jupyter都安装在我的电脑上,并且功能完全正常。
不是每次都在cmd中为pyspark创建.py脚本,我可以将它连接到我的Jupyter笔记本直播并在那里运行脚本吗?我已经看过许多关于如何在Linux和Mac上实现这一点的帖子,但遗憾的是我必须坚持使用Window 7。
谢谢! 将
答案 0 :(得分:1)
您可以使用Hortonworks中的Sandbox(http://hortonworks.com/downloads/#sandbox)并在Apache Zeppelin中运行您的代码。 无需设置。安装虚拟框并运行沙箱。然后通过主机(Windows)浏览器访问zeppelin和ambari,您最好运行%pyspark代码。 Zeppelin看起来像Jupyter。