我正在评估Spark Notebook,发现了三种不同的产品; 1. Hue 3.9附带Spark笔记本(测试版) 2. Apache zeppelin 3. andypetrella / spark-notebook。
您能否帮助我了解每种产品的优缺点
由于 聚苯胺
答案 0 :(得分:2)
我只和Hue和Jupyter一起玩过。
Hue是一种新的,但不仅提供Spark笔记本,它还集成了所有Hadoop组件(Oozie,Solr,Impala,HBase,Pig ......)。
如果你想要Pyspark的高级编辑器,Jupyter很棒。 Python编辑器非常好,它在Python社区非常流行。
答案 1 :(得分:0)
Jupyter是一个成熟的项目,而Spark Notebook是一个伟大但个人的努力acr_values,而Zeppelin正在孵化Apache,所以考虑到我们现代版本的#34;没有人被解雇购买IBM" (直到他们做了哈哈)和Jupyter是房间里的IBM。
查看Cloudera上的一些文档可能有所帮助,例如with good fairly recent explanation here from the author himself(注意Jupyter曾经被称为iPython Notebook)
如果您可以发布有关您的用例的更多信息,那么有助于人们回答您的问题http://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/。您的问题可能更适合另一个StackExchange站点。
and perhaps post what research you have already done, StackOverflow has specific requirements for good questions and a big emphasis is trying something first and posting code,就像Zeppelin更专注于在Hadoop(和Tachyon?我认为是透明层)上运行,而Zeppelin提供了一个可插拔的界面,因此您可以使用更多语言进行开发。