标签: python pyspark spark-dataframe
说我有一个pyspark数据帧:
df.show() +-----+---+ | x | y| +-----+---+ |alpha| 1| |beta | 2| |gamma| 1| |alpha| 2| +-----+---+
我想计算alpha列中出现beta,gamma和x的次数。我如何在pyspark中这样做?
alpha
beta
gamma
x
答案 0 :(得分:3)
使用pyspark.sql.DataFrame.cube():
pyspark.sql.DataFrame.cube()
df.cube("x").count().show()