有人试图在Apache Zeppelin上添加R解释器吗?

时间:2015-10-29 17:58:00

标签: apache-zeppelin

我目前正在使用Apache Zeppelin做一些数据可视化的东西,只是好奇为什么没有人为R提供解释器。从文档中看来,创建一个新的解释器似乎不应该太难,但如果它真的很容易,应该已经有各种语言的口译员,所以我错了吗?

3 个答案:

答案 0 :(得分:3)

修改

在新的zeppelin中,两个R解释器集成在其中。因此,我们不需要以下步骤来获取最新版本。

由于0.6.0未发布,我们需要克隆并构建它

R解释器1(来自Datalayer)

$git clone https://github.com/apache/incubator-zeppelin.git
$mvn clean package -Pspark-1.6 -Ppyspark -Phadoop-2.4 -Psparkr -DskipTests

R口译员2

$git clone https://github.com/apache/incubator-zeppelin.git
$mvn clean package -Pspark-1.6 -Ppyspark -Phadoop-2.4 -Pr -DskipTests

有关这些R口译员的更多信息,请访问here

对于低于0.6.0的zeppelin版本,请遵循LaurentH步骤

从数据层尝试this R Interpreter。我们已经尝试过并能够用它来做任何事情。

我们能够连接火花并使用它进行可视化。 说,有一些小问题,如

  1. 它没有表单支持。请参阅https://github.com/datalayer/zeppelin-R/issues/1
  2. 无法使用默认的Spark上下文。您必须在R解释器中创建Spark上下文并使用它
  3. 添加R解释器的步骤

    1. git clone https://github.com/datalayer/zeppelin-R.git
    2. 导航到zeppelin-R并运行mvn install
    3. 在incubator-zeppelin / interpreter中创建R文件夹
    4. 将zeppelin-R / target / zeppelin-R-1.0.0-SNAPSHOT.jar复制到incubator-zeppelin / interpreter / R
    5. https://oss.sonatype.org/content/repositories/snapshots/org/rosuda/REngine/REngine/2.1.1-SNAPSHOT/下载REngine jar并将其添加到incubator-zeppelin / interpreter / R文件夹中
    6. https://oss.sonatype.org/content/repositories/snapshots/org/rosuda/REngine/Rserve/1.8.2-SNAPSHOT/下载RServe jar并将其添加到incubator-zeppelin / interpreter / R文件夹中
    7. 将孵化器-zeppelin / conf / zeppelin-env.sh.template复制到incubator-zeppelin / conf / zeppelin-site.xml
    8. 编辑incubator-zeppelin / conf / zeppelin-site.xml并将“io.datalayer.zeppelin.R.RInterpreter”添加到zeppelin.interpreters
    9. 重启zeppelin
    10. 打开Zeppelin UI并单击Interpreter
    11. 点击“创建”按钮并添加R解释器
    12. 现在您可以在笔记本中使用R解释器
    13. 希望有所帮助

答案 1 :(得分:2)

尝试了塞缪尔亚历山大的程序,但没有设法得到zeppelin-R-1.0.0-SNAPSHOT.jar。 稍微改变一下步骤,我像这样整合了R:

  1. 设置https://github.com/datalayer/zeppelin-datalayer中所述的先决条件: R,R包,Spark in / opt / spark(或使用导出SPARK_HOME指定您现有的火花位置)
  2. git clone https://github.com/datalayer/zeppelin-R.git
  3. cd zeppelin-R
  4. git checkout rscala-z
  5. mvn clean install -Pspark-1.6 -Dspark.version = 1.6.0 \ -Dhadoop.version = 2.7.1 -Phadoop-2.6 -Ppyspark \ -Dmaven.findbugs.enable = false -Drat.skip = true -Dcheckstyle.skip = true \ -DskipTests \ -pl'!flink,!点燃,!凤凰,!postgresql,!tajo,!hive,!cassandra,!lens,!kylin'
  6. 将zeppelin-R / interpreter / spark / *复制到原始孵化器-zeppelin / interpreter / spark / *(包括zeppelin-spark-0.6.0-incubating-SNAPSHOT,其中包含SparkRInterpreter)
  7. 将孵化器-zeppelin / conf / zeppelin-site.xml.template复制到incubator-zeppelin / conf / zeppelin-site.xml
  8. 编辑incubator-zeppelin / conf / zeppelin-site.xml并将“org.apache.zeppelin.spark.SparkRInterpreter”添加到zeppelin.interpreters(这将在spark解释器组中添加%r)
  9. 重启zeppelin
  10. 希望它可以提供帮助。

答案 2 :(得分:0)

我正在尝试使用zeppelin-R解释器和孵化器-zeppelin - 你能描述一下Zeppelin如何识别这个解释器吗?

我设法编译并运行incubator-zeppelin并且可以编译zeppelin-R。 然后,我将zeppelin-R目录复制到incubator-zeppelin根目录中,并将CREATE TABLE my_table( id INT PRIMARY KEY, name VARCHAR(50) ); ALTER TABLE my_table CHANGE id id INT AUTO_INCREMENT ; 添加到根目录中的pom.xml。 我可以毫无问题地重新编译孵化器-zeppelin,但R解释器不​​会出现在Zeppelin中。