我有一个外部自定义jar,我想与Azure HDInsight Jupyter笔记本一起使用; HDI中的Jupyter笔记本使用Spark Magic和Livy。
在笔记本的第一个单元格中,我正在尝试使用jars
配置:
%%configure -f
{"jars": ["wasb://$container$@$account#.blob.core.windows.net/folder/my-custom-jar.jar"]}
但我收到的错误信息是:
Starting Spark application
The code failed because of a fatal error:
Status 'shutting_down' not supported by session..
Some things to try:
a) Make sure Spark has enough available resources for Jupyter to create a Spark context. For instructions on how to assign resources see http://go.microsoft.com/fwlink/?LinkId=717038
b) Contact your cluster administrator to make sure the Spark magics library is configured correctly.
Current session configs: {u'jars': [u'wasb://$container$@$account#.blob.core.windows.net/folder/my-custom-jar.jar'], u'kind': 'spark'}
An error was encountered:
Status 'shutting_down' not supported by session.
我想知道我是否只是不理解Livy在这种情况下是如何工作的,因为我能够在同一个集群中成功包含spark-package(GraphFrames):
%%configure -f
{ "conf": {"spark.jars.packages": "graphframes:graphframes:0.3.0-spark2.0-s_2.11" }}
一些额外的参考资料可能很方便(以防万一我错过了一些东西):
答案 0 :(得分:3)
哦,我能够搞清楚,忘了更新我的问题。如果将jar放在HDI群集的默认存储帐户中,则此方法可以正常工作。
HTH!
答案 1 :(得分:1)
以防人们来这里在 EMR 上添加 jar。
%%configure -f
{"name": "sparkTest", "conf": {"spark.jars": "s3://somebucket/artifacts/jars/spark-avro_2.11-2.4.4.jar"}}
与 document 相反,直接使用 jars
不起作用。