在Livy PySpark的HDFS中存储Python包

时间:2018-11-15 18:29:31

标签: python apache-spark pyspark livy

我正在通过Livy将PySpark作业提交给集群。目前,依赖的python软件包(如NumPy,Pandas,Keras等)已安装在所有datanode上。想知道是否所有这些软件包都可以集中存储在HDFS中,以及如何配置Livy,PySpark从HDFS而不是从该数据节点读取这些软件包。

0 个答案:

没有答案