AttributeError:“ RDD”对象没有属性“ show”

时间:2018-12-04 18:04:56

标签: python apache-spark pyspark

from pyspark import SparkContext, SparkConf, sql
from pyspark.sql import Row
sc = SparkContext.getOrCreate()
sqlContext = sql.SQLContext(sc)
df = sc.parallelize([ \
                 Row(nama='Roni', umur=27, tingi=168), \
                 Row(nama='Roni', umur=6, tingi=168),
                 Row(nama='Roni', umur=89, tingi=168),])

df.show()
  

错误:   追溯(最近一次通话):

     

df.show()中第8行的文件“ ipython-input-24-bfb18ebba99e”

     

AttributeError:“ RDD”对象没有属性“ show”

1 个答案:

答案 0 :(得分:3)

由于df是rdd,该错误已清除。您应该使用toDF将其更改为数据框,如以下代码所示:

df = df.toDF()
df.show()