我试图在PyCharm IDE中执行我的第一个PySpark代码,并面临以下异常。
from pyspark import SparkContext
def example():
sc = SparkContext('local')
words = sc.parallelize(["scala", "java", "hadoop", "spark", "akka"])
print(sc.getConf().getAll())
return words.count()
print(example())
并打印以下数据。
[('spark.master', 'local'), ('spark.rdd.compress', 'True'), ('spark.serializer.objectStreamReset', '100'), ('spark.driver.port', '59627'), ('spark.executor.id', 'driver'), ('spark.submit.deployMode', 'client'), ('spark.app.id', 'local-1526547201037'), ('spark.driver.host', 'LAPTOP-DDRRK6SB'), ('spark.ui.showConsoleProgress', 'true'), ('spark.app.name', 'pyspark-shell')]
以及以下例外。
py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.collectAndServe.
: java.lang.IllegalArgumentException
对不起我的英文,期待代码出了什么问题。
答案 0 :(得分:1)
我不知道确切的问题,回滚到1.8.0_171到这个java版本,它工作正常。感谢Rumoku的建议。