Pyspark群集中的ConfigParser没有分段错误

时间:2017-11-20 08:23:58

标签: apache-spark pyspark submit configparser

我在pyspark中有一个项目,我实现了ConfigParser来加载config.properties文件中的一些设置。

在本地,它工作正常,到目前为止没有任何问题......

但是在群集上它会抛出没有部分错误。

我抓取互联网并找到了一些解决方案,即向--files

的执行者抛出spark-submit参数提供属性文件

我使用' SparkFiles.get(' file')'来获取文件路径。像这样:

config = ConfigParser.SafeConfigParser(os.environ)
config.read(SparkFiles.get('file'))

但是当我使用config.get("SECTION","name")访问函数中的变量时,它会抛出No Section错误。

这是代码流程。 在main.py我初始化SparkContext

然后使用import语句我导入Utility.py在顶部我执行此操作:

config = ConfigParser.SafeConfigParser(os.environ)
config.read(SparkFiles.get('file'))

然后在接下来我调用来自Utility.py的函数,我尝试访问config.get("SECTION","name")。出现错误。

1 个答案:

答案 0 :(得分:0)

不要将属性文件读取为config.read(SparkFiles.get(' file'))如果你在--files中传递文件而spark提交你的工作将得到它文件名本身。

尝试阅读config.read(' file')。它适用于我的纱线客户端模式