如何使用group by子句对pyspark中的列进行排名

时间:2019-11-28 07:23:18

标签: pyspark pyspark-sql pyspark-dataframes

我有一个看起来像这样的数据框:

 A     B    C   
---------------
A1    B1   C1
A1    B1   C2
A1    B1   C3

A2    B1   C1
A2    B1   C2
A2    B1   C3

A3    B2   C1
A3    B2   C2
A3    B2   C3

如何按A,B列进行排名?预期输出:

 A     B    C   rank
-----------------------
A1    B1   C1    1
A1    B1   C2    2
A1    B1   C3    3

A2    B1   C1    1
A2    B1   C2    2
A2    B1   C3    3

A3    B2   C1    1
A3    B2   C2    2
A3    B2   C3    3

我想对A,B列进行分组,并根据C列的值变化给出排名。.

1 个答案:

答案 0 :(得分:0)

您可以尝试以下方法吗?

temporaryExclusiveTouchView