Summary: Running into "Py4JJavaError" while converting list to Dataframe using
Python,Jupyter笔记本 钥匙:SPARK-24612 网址:https://issues.apache.org/jira/browse/SPARK-24612 项目:星火 问题类型:问题 组件:PySpark 影响版本:2.3.1 环境:> python --version
Python 3.6.5 :: Anaconda,Inc。
java -version
java版本“ 1.8.0_144” Java(TM)SE运行时环境(内部版本1.8.0_144-b01) Java HotSpot(TM)64位服务器VM(内部版本25.144-b01,混合模式)
jupyter --version
4.4.0
conda -V
conda 4.5.4
spark-2.3.0-bin-hadoop2.7 记者:A B
rdd = sc.parallelize([[1,“ Alice”,50],[2,“ Bob”,80]])
rdd.collect() [[1,“ Alice”,50],[2,“ Bob”,80]]
但是,当我运行df = rdd.toDF()时 我遇到以下错误:非常感谢您解决此错误的任何帮助。
答案 0 :(得分:0)
那是因为您使用不一致的类型:
int
。str
。因此类型与推断的架构不兼容。