在执行PySpark代码时遇到Py4JJavaError

时间:2018-05-17 08:58:55

标签: python apache-spark pyspark pycharm

enter image description here我试图在PyCharm IDE中执行我的第一个PySpark代码,并面临以下异常。

from pyspark import SparkContext


def example():
    sc = SparkContext('local')
    words = sc.parallelize(["scala", "java", "hadoop", "spark", "akka"])
    print(sc.getConf().getAll())
    return words.count()


print(example())

并打印以下数据。

[('spark.master', 'local'), ('spark.rdd.compress', 'True'), ('spark.serializer.objectStreamReset', '100'), ('spark.driver.port', '59627'), ('spark.executor.id', 'driver'), ('spark.submit.deployMode', 'client'), ('spark.app.id', 'local-1526547201037'), ('spark.driver.host', 'LAPTOP-DDRRK6SB'), ('spark.ui.showConsoleProgress', 'true'), ('spark.app.name', 'pyspark-shell')]

以及以下例外。

py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.collectAndServe.
: java.lang.IllegalArgumentException

对不起我的英文,期待代码出了什么问题。

1 个答案:

答案 0 :(得分:1)

我不知道确切的问题,回滚到1.8.0_171到这个java版本,它工作正常。感谢Rumoku的建议。