如何从pyspark中的一列创建数据框?

时间:2019-07-24 11:39:49

标签: pyspark

我在pyspark中切出了Column类型的一列。

x =game_reviews.groupBy("product_id_index").agg((F.count('star_rating').alias('num')  ) 
x.num

给予

Column<b'num'>

但是这个

new_df = spark.createDataFrame(x.num)
new_df.show()

给出错误。

1 个答案:

答案 0 :(得分:1)

您想要实现的是一个简单的单线。祝你好运!

new_df = game_reviews.groupBy("product_id_index").agg((F.count('star_rating').alias('num')).select("num")
new_df.show()