我在pyspark中切出了Column类型的一列。
x =game_reviews.groupBy("product_id_index").agg((F.count('star_rating').alias('num') )
x.num
给予
Column<b'num'>
但是这个
new_df = spark.createDataFrame(x.num)
new_df.show()
给出错误。
答案 0 :(得分:1)
您想要实现的是一个简单的单线。祝你好运!
new_df = game_reviews.groupBy("product_id_index").agg((F.count('star_rating').alias('num')).select("num")
new_df.show()