我必须将数据框保存到Pickle文件,但它会返回错误
o.a.s.sql.Dataset
AttributeError:' Dataframe'对象没有属性' saveAsPickleFile'
答案 0 :(得分:5)
saveAsPickleFile
是RDD
的方法,而不是数据框。
请参阅此文档: http://spark.apache.org/docs/latest/api/python/pyspark.html?highlight=pickle
所以你可以打电话:
df.rdd.saveAsPickleFile(filename)
要从文件加载,请运行:
pickleRdd = sc.pickleFile(filename).collect()
df2 = spark.createDataFrame(pickleRdd)