修改强>
在新的zeppelin中,两个R解释器集成在其中。因此,我们不需要以下步骤来获取最新版本。
由于0.6.0未发布,我们需要克隆并构建它
R解释器1(来自Datalayer)
$git clone https://github.com/apache/incubator-zeppelin.git
$mvn clean package -Pspark-1.6 -Ppyspark -Phadoop-2.4 -Psparkr -DskipTests
R口译员2
$git clone https://github.com/apache/incubator-zeppelin.git
$mvn clean package -Pspark-1.6 -Ppyspark -Phadoop-2.4 -Pr -DskipTests
有关这些R口译员的更多信息,请访问here
对于低于0.6.0的zeppelin版本,请遵循LaurentH步骤
从数据层尝试this R Interpreter。我们已经尝试过并能够用它来做任何事情。
我们能够连接火花并使用它进行可视化。
说,有一些小问题,如
- 它没有表单支持。请参阅https://github.com/datalayer/zeppelin-R/issues/1
- 无法使用默认的Spark上下文。您必须在R解释器中创建Spark上下文并使用它
醇>
添加R解释器的步骤
- git clone https://github.com/datalayer/zeppelin-R.git
- 导航到zeppelin-R并运行mvn install
- 在incubator-zeppelin / interpreter中创建R文件夹
- 将zeppelin-R / target / zeppelin-R-1.0.0-SNAPSHOT.jar复制到incubator-zeppelin / interpreter / R
- 从https://oss.sonatype.org/content/repositories/snapshots/org/rosuda/REngine/REngine/2.1.1-SNAPSHOT/下载REngine jar并将其添加到incubator-zeppelin / interpreter / R文件夹中
- 从https://oss.sonatype.org/content/repositories/snapshots/org/rosuda/REngine/Rserve/1.8.2-SNAPSHOT/下载RServe jar并将其添加到incubator-zeppelin / interpreter / R文件夹中
- 将孵化器-zeppelin / conf / zeppelin-env.sh.template复制到incubator-zeppelin / conf / zeppelin-site.xml
- 编辑incubator-zeppelin / conf / zeppelin-site.xml并将“io.datalayer.zeppelin.R.RInterpreter”添加到zeppelin.interpreters
- 重启zeppelin
- 打开Zeppelin UI并单击Interpreter
- 点击“创建”按钮并添加R解释器
- 现在您可以在笔记本中使用R解释器
醇>
希望有所帮助
尝试了塞缪尔亚历山大的程序,但没有设法得到zeppelin-R-1.0.0-SNAPSHOT.jar。
稍微改变一下步骤,我像这样整合了R:
- 设置https://github.com/datalayer/zeppelin-datalayer中所述的先决条件:
R,R包,Spark in / opt / spark(或使用导出SPARK_HOME指定您现有的火花位置)
- git clone https://github.com/datalayer/zeppelin-R.git
- cd zeppelin-R
- git checkout rscala-z
- mvn clean install -Pspark-1.6 -Dspark.version = 1.6.0 \
-Dhadoop.version = 2.7.1 -Phadoop-2.6 -Ppyspark \
-Dmaven.findbugs.enable = false -Drat.skip = true -Dcheckstyle.skip = true \
-DskipTests \
-pl'!flink,!点燃,!凤凰,!postgresql,!tajo,!hive,!cassandra,!lens,!kylin'
- 将zeppelin-R / interpreter / spark / *复制到原始孵化器-zeppelin / interpreter / spark / *(包括zeppelin-spark-0.6.0-incubating-SNAPSHOT,其中包含SparkRInterpreter)
- 将孵化器-zeppelin / conf / zeppelin-site.xml.template复制到incubator-zeppelin / conf / zeppelin-site.xml
- 编辑incubator-zeppelin / conf / zeppelin-site.xml并将“org.apache.zeppelin.spark.SparkRInterpreter”添加到zeppelin.interpreters(这将在spark解释器组中添加%r)
- 重启zeppelin
醇>
希望它可以提供帮助。
我正在尝试使用zeppelin-R解释器和孵化器-zeppelin - 你能描述一下Zeppelin如何识别这个解释器吗?
我设法编译并运行incubator-zeppelin并且可以编译zeppelin-R。
然后,我将zeppelin-R目录复制到incubator-zeppelin根目录中,并将CREATE TABLE my_table(
id INT PRIMARY KEY,
name VARCHAR(50)
);
ALTER TABLE my_table CHANGE id id INT AUTO_INCREMENT ;
添加到根目录中的pom.xml。
我可以毫无问题地重新编译孵化器-zeppelin,但R解释器不会出现在Zeppelin中。