from pyspark import SparkContext, SparkConf, sql
from pyspark.sql import Row
sc = SparkContext.getOrCreate()
sqlContext = sql.SQLContext(sc)
df = sc.parallelize([ \
Row(nama='Roni', umur=27, tingi=168), \
Row(nama='Roni', umur=6, tingi=168),
Row(nama='Roni', umur=89, tingi=168),])
df.show()
错误: 追溯(最近一次通话):
df.show()中第8行的文件“ ipython-input-24-bfb18ebba99e”
AttributeError:“ RDD”对象没有属性“ show”
答案 0 :(得分:3)
由于df
是rdd,该错误已清除。您应该使用toDF
将其更改为数据框,如以下代码所示:
df = df.toDF()
df.show()