在Zeppelin,我必须在每行提供每行的翻译。有没有办法为整个会话设置解释器。
%pyspark
import re
花了0秒。
import pandas as pd
console:1:错误:'。'预期但找到了标识符。将pandas导入为pd
%pyspark
import pandas as pd
花了0秒。
如何为整个会话设置解释器?
答案 0 :(得分:6)
Spark解释器组目前有4个解释器,如此处所列......
https://zeppelin.incubator.apache.org/docs/0.5.0-incubating/interpreter/spark.html
默认解释器为%spark
,并根据 zeppelin-site.xml 配置文件中zeppelin.interpreters
属性中列出的解释器顺序选择默认解释器。 / p>
zeppelin-site.xml(zeppelin.interpreters
属性)中解释器的当前顺序将是这个......
org.apache.zeppelin.spark.SparkInterpreter,org.apache.zeppelin.spark.PySparkInterpreter
将此修改为...
org.apache.zeppelin.spark.PySparkInterpreter, org.apache.zeppelin.spark.SparkInterpreter
并重新启动Zeppelin(zeppelin-daemon.sh restart
)
这会使%pyspark
成为默认解释器。
由于
答案 1 :(得分:1)
上述答案对最近的Zeppelin版本无效。
要设置默认解释器,请检查/etc/zeppelin/conf/interpreter.json
并查找以下内容:
...
{
"name": "spark",
"class": "org.apache.zeppelin.spark.SparkInterpreter",
"defaultInterpreter": true,
"editor": {
"language": "scala",
"editOnDblClick": false
}
},
...
{
"name": "pyspark",
"class": "org.apache.zeppelin.spark.PySparkInterpreter",
"defaultInterpreter": false,
"editor": {
"language": "python",
"editOnDblClick": false
}
}
现在一切似乎微不足道。我们只需将defaultInterpreter
的{{1}}更改为spark
,将false
defaultInterpreter
更改为pyspark
。
然后重启zeppelin(true
)。
答案 2 :(得分:0)
甚至菲什博尔对齐柏林飞艇的回答也似乎过时了。我的conf/interpreter.json
默认使用spark("defaultInterpreter": true
)和python / pyspark("defaultInterpreter": false
),但Zeppelin选择了默认的python / pyspark。就我而言,我想在pyspark上发扬光大。
解决方案是仅在Zeppelin Web控制台的interpreter binding
部分中拖放解释器。