新手(spark数据帧) - df.count()。show()返回AttributeError

时间:2017-02-07 22:52:15

标签: python apache-spark-sql spark-dataframe

为新手问题道歉。我只是在学习。

我只是尝试从Cloudant数据库创建一个spark数据帧并计算条目数。在调用函数进行计数后,我收到一个错误:

AttributeErrorTraceback (most recent call last)
<ipython-input-5-56a7e10a510b> in <module>()
----> 1 count(cloudantdata,spark)

<ipython-input-2-f2dcd9d73d7e> in count(df, spark)
      1 def count(df,spark):
      2     #TODO Please enter your code here
----> 3     df.count().show()
      4     return

AttributeError: 'int' object has no attribute 'show'

请参阅笔记本: https://apsportal.ibm.com/analytics/notebooks/c83c959b-2994-4ac7-9af7-f9d33d4dc461/view?access_token=6a057cadfdd07252e5977a5eb65936185673dd1d1213ab8a003874edbfde6808

1 个答案:

答案 0 :(得分:2)

count()操作(与转换相对),因此它返回一个非DataFrame对象 - 在本例中为{{1表示DataFrame中的行数。 int上没有名为int的方法。

只需show()