如何在Scala Spark中为数据框的每个组获取前两个最大值?

时间:2019-05-09 07:32:18

标签: scala apache-spark

说我有一个像这样的数据框-

+--------+-------+
|identity|b_value|
+--------+-------+
|       A|     30|
|       A|     20|
|       A|     40|
|       A|      3|
|       B|     10|
|       B|     11|
|       B|      4|
|       C|    100|
|       C|     90|
|       C|    400|
+--------+-------+

现在我想为每个这样的身份获取前两个最大b_value-

+--------+-------+
|identity|b_value|
+--------+-------+
|A       |40     |
|A       |30     |
|B       |11     |
|B       |10     |
|C       |400    |
|C       |100    |
+--------+-------+

0 个答案:

没有答案